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Zusammenf assung 



Tumorassoziiertes Antigen B345 und dafiir kodierende 
DNA-Molekule . 
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Die Erfindung bezieht sich auf die Chemotherapie von 
Tumorerkrankungen . 

Normale Korperzellen unterliegen einem strikt geordneten 
5 System, das das Wachstum, die Zellteilung und das 

Absterben bestimmter Zellen kontrolliert. So teilen sich 
Korperzellen einer erwachsenen Person nur dann, wenn sie 
tote Zellen ersetzen oder eine Verletzung verheilen 
mussen. Krebszellen dagegen wachsen unkontrolliert 

10 weiter, sie akkumulieren und bilden einen Tumor. 
Erreicht der Tumor eine kritische Grofie, konnen 
Krebszellen liber die Blutbahnen oder das Lymphsystem 
auch in andere Bereiche des Korpers transportiert werden 
und dort Kolonien bilden (Metastasen) . Nicht alle Tumore 

15 sind kanzerogen, denn benigne Tumore metastasieren nicht 
und sind daher meistens nicht lebensgef ahrlich, da sie 
chirurgisch entfernt werden konnen. Detailliertere 
Inf ormationen zu diesem Thema sowie den welter unten 
diskutierten Aspekten der Tumorentstehung geben folgende 

20 Publikationen: Rauscher und Vogt, 1997; Kastan, 1997; 
Hesketh, 1995; Pusztai, Lewis und Yap, 1995, 

Die Transformation einer gesunden Zelle in eine 
Krebszelle kann durch eine ganze Reihe von Faktoren, wie 
Umwelteinf liisse, Strahlung, Viren oder chemische 
25 Reagenzien ausgelost werden. Bei der Tumorentwicklung 
spielen jedoch auch epigenetische (Methylierungen, 
Acetylierungen und veranderte Chromatinstruktur ) und 
genet is che Modif ikationen ( Punktmutation, Deletion, 
Amplif ikation, Translokation) eine bedeutendende Rolle. 
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Mutationen in kodierenden Bereichen von Genen, die an 
der Regulation der Zell-Prolif eration beteiligt sind, 
konnen an der Uberfuhrung einer normalen Zelle in eine 
Tumorzelle beitragen, da die transf ormierte Zelle 
5 Wachstumsvorteile gegenuber ihrer gesunden Nachbarzelle 
hat . 

Krebs entsteht also durch eine Ansammlung von vererbten 
Oder erworbenen Mutationen in kritischen Protoonkogenen 
Oder Tumorsuppressorgenen . 

10 Die Zellprolif eration steht unter der Kontrolle 

verschiedener Gensysteme, wahrend Produkte von Onkogenen 
an der Signalvermittlung von Zelloberf lache zum Zellkern 
beteiligt sind, geleiten cyclinabhangige Proteinkinase 
und ihre Inhibitoren die Zelle durch den Zellzyklus. 

15 Nicht selten werden Storungen in der Synthese dieser 

Proteine bei Tumorzellen gefunden. Eine zentrale Rolle 
spielt dabei das p53-Protein. 

Proteine vom Typ des RB-Proteins regulieren die 
Verf iigbarkeit entscheidender Transkriptionsf aktoren . 

20 Die in Tumorgeweben hochregulierten Gene stellen meist 
den Ausgangspunkt ftir weitere detaillierte Analysen dar 
und da Proteine verschiedenster Funktionen 
hochexprimiert werden, ist der Ansatz fiir therapeutische 
Interventionen sehr vielseitig. Es ist daher/tias Ziel 

25 der Krebsf orschung weitere neue Zielmolekule' (sog» 

./Targets'"^ ) ftir therapeutische Interventionen zu f inden, 
die dann fiir eine gezielte Therapie mit geringen 
Nebenwirkungen benutzt werden konnen. 
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In erster Linie gilt es daher molekulare Veranderungen 
zwischen Normalgewebe und Tumor auf dem Niveau der 
Genexpression ( „Transkriptionslevel" ) auf zudecken, die 
einerseits neue Targets identif izieren sollen und 
5 andererseits fur die Entwicklung bzw. das Auffinden von 
Substanzen zur Heminung von Fehlf unktionen herangezogen 
warden konnen. 

Eine ganze Reihe verschiedenster Methoden zur 

Identif izierung und Charakterisierung von neuen Targets, 

10 die den Ausgangspunkt fiir die Entwicklung von neuen 
Therapeutika darstellen, basieren auf der Erstellung 
dif f erenzieller mRNA Transkriptionsprof ile zwischen 
Tumoren und Normalgeweben . Dazu.zahlen die 
dif f erenzielle Hybridisierung, die Erstellung von 

15 Subtraktions-cDNA-Banken representational difference 
analysis"; Hubank und Schatz, 1994; Diatchenko et al., 
1996) und der Einsatz der DNA-Chip Technologie oder der 
SAGE-Methode (Velculescu et al., 1995). 

Neben immuntherapeutischen Ansatzen kommt der gezielten 
20 Chemotherapie eine wesentliche Rolle bei der Behandlung 
von Krebs zu. Unter Chemotherapie versteht man die 
Verabreichung von Substanzen, die durch Eingriff in 
Stof fwechsel, Signaltransduktion und 
Zellteilungsvorgange maligner ?;ellen entweder 
25 zytostatisch oder zytotoxisch-zytolytisch wirken. 
Chemotherapeutika lassen sich auf Grund der 
Beeinf lussung von spezifischen Targets in der 
Tumorzelle, nach Art der zellularen Interaktion und der 
Wechselwirkung mit einer bestimmten Zellzyklusphase, in 
30 verschiedene Kategorien unterteilen. 
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Die Art der Krebsbehandlung hangt vom Tumorstadium ab, 
entscheidend ist dabei, ob bereits Metastasen vorhanden 
sind und wie weit diese im Korper verbreitet sind. Die 
Applikation von Zellgiften zur Krebsbehandlung ist, 
5 neben operativen MaBnahmen und der Strahlentherapie, ein 
integraler Bestandteil der heutigen Therapiekonzepte in 
der Onkologie. 

Im wesentlichen gibt es zwei Hauptziele der 
Chemotherapie : In erster Linie ist es die Heilung von 
10 Krebs; das bedeutet, dass der Tumor verschwindet und 
nicht mehr auftritt. Ist eine Heilung aus 

verschiedensten Grunden nicht mehr moglich, versucht man 
den Tumor in seinem Wachstum und seiner Ausbreitung 
einzuschranken bzw. zu kontrollieren . 

15 Prinzipiell entfalten Substanzen, die bei der 

Chemotherapie Anwendung finden, ihre Wirkung bei alien 
sich teilenden Zellen, Tumorzellen zeigen jedoch eine 
hohere Empf indlichkeit gegeniiber Chemotherapeutika als 
gesunde Zellen, da hauptsachlich stark prolif erierende 

20 Zellen angegriffen werden. 

Jedes Gewebe hat ein charakteristisches Wachstums- 
verhalten, das Zellteilung, Wachstumsstillstand, 
Dif f erenzierung und Alterung umfasst und durch interne 
und externe .Faktoren beeinflusst und reguliert wird- 

25 Viele der heute eingesetzten zytotoxischen 

Chemotherapeutika wirken nur bei prolif erierenden Zellen 
(nicht in der GO-Phase der Zellteilung) . Dabei werden 
allerdings sowohl Normal- als auch Krebszellen 
attackiert. Die Zerstorung von normalen Zellen kann zu 

30 starken Nebenef f ekten fuhren; z.B. Zerstorung der 
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Blutzellen-produzierenden Gewebe des Knochenmarks 
(Myelosuppression) . 

Chemotherapeutika werden je nachdem, wie sie spezifische 
Substanzen innerhalb der Tumorzelle beeinf lussen, mit 
5 welchen zellularen Prozessen die Medikamente 
interagieren und welche Zellzyklusphase sie 
beeinf lussen, in verschiedene Kategorien unterteilt. 
Diese Inf ormationen sind fur Onkologen notwendig fiir die 
Entscheidung welche Praparate bei der Therapie 
10 miteinander kombiniert werden konnen. 

Die in Tumorgeweben hochregulierten Gene stellen somit 
potentielle neue Zielstrukturen dar und da Proteine 
verschiedenster Funktionen hochexprimiert werden, ist 
der Ansatz fiir therapeutische Interventionen sehr 
15 vielseitig. 

Es ist daher das Ziel der Krebsf orschung, weitere neue 
Targets fiir therapeutische Interventionen zu finden, die 
dann fiir eine gezielte Therapie mit - verglichen mit 
derzeitig eingesetzten Therapeutika - geringeren 
2 0 Nebenwirkungen benutzt werden konnen. 

In Tumorgeweben hochregulierte Gene stellen 
Angrif f spunkte und somit potentielle Zielstrukturen 
^ („Targets'M fiir die Chemotherapie dar. 

Aufgabe der vorliegenden Erfindung war es, ein neues, 
25 bevorzugt von Tumorzellen exprimiertes Protein 
bereitzustellen, das ein Zielmolekul fiir die 
Intervention mittels chemotherapeutischer Methoden 
darstellt . 
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Diese Aufgabe wurde ..gelost , indem zunachst mittels RDA 
( ^representational difference analysis") zwischen einer 
Lungen-Adeno kar z inom- Ze 1 1 1 inie ( A5 4 9 ) und 
Normal lungengewebe eine cDNA-Substraktionsbibliothek 
5 hergestellt wurde. Zur Selektion der im Tumor 

iiberexprimierten Antigens wurden anschliefiend die 
erhaltenen cDNA-Klone sequenziert und mit in Datenbanken 
verfugbaren Sequenzen verglichen. Unter den dabei 
annotierten Genen befanden sich 321 unbekannte, zu denen 
10 grolitenteils ESTs expressed sequence tags") -Eintrage 

i 

^ in der Datenbank existierten. Nach einer weiteren 

qualitativen PCR-Analyse in cDNA-Bibliotheken von 
kritischen Normalgeweben und immunprivilegierten Geweben 
sowie detaillierteren Datenbankrecherchen wurde die 
15 Anzahl der Kandidatenklone auf 59 eingeschrankt , deren 
ESTs nicht aus kritischen Normalgeweben stammen. 

Diese Klone wurden auf Incyte DNA Chips gespottet und 
mit einer ganzen Reihe von Tumorgeweben und 
Normalgeweben als Referenz hybridisiert . Das mRNA 
20 Expressionsprof il von EST Fragmenten, die in 
> Krebsgeweben und Normalgeweben dif f erentiell exprimiert 

^ werden und zu einem noch unbekannten Gen gehoren, wurde 

mit unterschiedlichen Methoden verifiziert- 

Die Lange der Transkripte wurde mittels Northern blot 
25 Analyse bestimmt und das Expressionsmuster in 

verschiedenen Zellsystemen durch quantitative PGR exakt 
charakterisiert . Nur unbekannte Gene bzw. ESTs mit 
tumorspezif ischen Expressionsprof il wurden 
weiterverf olgt und einer "full length Klonierung" 
30 unterworfen, Potentielle ORFs („open reading frames'") 
werden in die entsprechende Aminosauresequenz 
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umgewandelt und zur moglichen Funktionsvorhersage 
mittels in silico Strategien analysiert- 

Die humane B345-cDNA wurde kloniert, die in einem ersten 
Klonierungsansat z erhaltene Sequenz ist in SEQ ID N0:1 
dargestellt. Die Sequenzanalyse der in diesem Ansatz 
klonierten humanen B345-cDNA zeigte einen durchgehenden 
offenen Leserahmen von Position 215 bis Position 2461 

(exklusive Stopcodon) , der, auf Nukleotid- und 
Proteinebene, in den bekannten Sequenzen der Datenbanken 
keine Homologie oder Identitat aufweist. Aus den aus 
Northern Blot Experimenten gewonnenen Daten ist zu 
schlielien, dass das B34 5-Transkript eine Lange von ca. 
6,5 kb hat. In einem ersten Ansatz wurde als klonierter 
Bereich eine B345-cDNA mit 5897 bp (exklusive polyA- 
Region) , erhalten, wobei das Vorhandensein eines 
Polyadenylationssignals und des PolyA-Tails am 3 ' -Ende 
der Sequenz auf die Vollstandigkeit der cDNA in diesem 
Bereich hindeutete. Aufgrund der Tatsache, dass im 
5 '-Bereich der klonierten cDNA von Position 1 bis 214 
kein durchgehender Leserahmen aufschien, wurde zunachst 
angenommen, dass es sich bei dem ATG an Position 215, 
die auch zu 75% einer Kozak Translationinitiationsstelle 

(ACCATGT) (Kozak, 1987) entspricht, um das Startkodon 
von B345 handelt- 

In einem weiteren Klonierungsansat z wurden mittels einer 
molekularbiologischen Standardmethode, und zwar mittels 
sog, ^Promoter Finder DNA Walking^\ zusatzliche 
Inf ormationen iiber die welter stromauf warts liegende 
Sequenz von B345 gewonnen. 



9 



Somit wurde die in dem ersten Klonierunsversuch 
erhaltene B345-Sequen2 (SEQ ID N0:1) in der 5 'Region 
erweitert. Der Transkriptionsstart konnte unter 
Anwendung der Primer Extension Analyse genau lokalisiert 
5 werden und liegt bei Position 201 (SEQ ID NO: 3). Durch 
wiederholte Sequenzierungen auch in der 3 'Region wurde, 
im Vergleich zur in SEQ ID NO:l dargestellten Sequenz, 
eine zusatzliche Base an Position 2430 gefunden, die zu 
einer Leserasterverschiebung flihrt und somit das 

10 Stoppcodon von Position 2729 auf 2791 verschiebt. Die 
erhaltene cDNA (SEQ ID NO: 3) besitzt einen offenen 
Leserahmen, der fur ein potentielles Protein mit einer 
Lange von 836 Aminosauren (SEQ ID NO: 4) kodiert. Die 
Translationsinitiationsstelle an Position 283 entspricht 

15 etwa zu 70% einer Kozak-Konsensussequenz . 

Die Promotorregion 200bp upstream der mutmafilichen 
Transkriptionsstartstelle enthalt weder eine TATA noch 
eine CCAAT box, jedoch eine eindeutige GC-box, welche 
eine Bindungsstelle des SPl Proteins darstellt. Die 
20 Tatsache , dass der GC Gehalt in der 5 'Region liber 60% 
ist, deutet auf ein CpG Island hin (Bird, 1986) - 

Die resultierende primare Aminosauresequenz von B345 ist 
in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz zeigt, dass dag B345 Protein 
25 zwei charakteristische hydrophobe Domanen' aufweist, die 
ein Signalpeptid und eine helikale Transmembrandomane 
darstellen (Fig. 6) . Diese polarisierte' Struktur deutet 
darauf hin, dass es sich bei B345 um ein integrales 
Membraneprotein handelt- 
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Die extrazellulare Domane lalit auf die Existenz von 
definitiv einer, gegebenenf alls drei, CUB Domanen 
schlielien. CUB Domanen kommen bei verschiedenen, meist 
wahrend der Embryonalentwicklung regulierten Proteinen 
5 vor. Eine kurzlich erschienene Publikation (Gerstein et 
al., 2000) demonstriert , daft CUB Domanen enthaltende 
Proteine die am ausgepragtesten dif f erenziell 
regulierten Proteine in C. elegans sind. Da Gene, die 
eine Schlusselrolle in der Embryonalentwicklung haben, 

10 entsprechende Funktionen, z.B. in der Zellteilung, der 
Zellprolif eration oder Signalubertragung, in Krebs 
ausfiihren, kann angenommen werden, dass eine 
Uberexpression von B345 in Zellen eine Veranderung in 
den Eigenschaf ten der Substratadhasion oder der 

15 extrazellularen Matrix bewirkt. Das B345 Protein weist 
12 potentielle N-Glycosylierungsstellen auf, die in der 
mutmaftlichen extrazellularen Domane zu finden sind. 

Aufgrund seiner Aminosauresequenz ist anzunehmen, dass 
das B345-Protein eine ft-Sheet Sekundarstruktur 
20 ausbildet, da sich CUB Domanen bekanntlich als 
ft-Sandwich fait en . 

Die intrazellulare Domane (Bereich 691-836) weist keine 
signif ikanten Homologien auf. Der gesamte C-Terminus 
zeigt jedoch eine Identitat (82%) liber 124 Aminosauren 
25 mit einem EST (Acc No. AW063026) aus humanen 

Eierstockkrebs Zellen. i 

\ 

Ausgehend von den Funktionen anderer CUB Domanen 
enthaltender Proteine kann gefolgert werden, daft das 
B345 Transmembranprotein in der Kommunikation, der 
30 Interaktion und/oder der Signaltransduktion mit 
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extrazellularen Komponenten oder Liganden eine Rolle 
spielt. Ferner sind die Daten der Expressionsanalyse ein 
starkes Indiz dafiir, dass B345 beim metastatischen 
Prozess von Krebs, insbesondere Dickdarmkrebs, beteiligt 
5 ist . 

Fur die Aufklarung der physiologischen Funktion und der 
Rolle von B345 bei der Metastasierung sind folgende 
Untersuchungsmethoden geeignet: 

Zunachst werden Zelllinien, vorzugsweise humane 
10 Zelllinien identif iziert , z.B. mittels TaqMan PGR, die 
B345 nicht endogen exprimieren . Die Zellen werden mit 
einem Plasmid, das die B345-Sequen2 enthalt, 
transfiziert und B345 exprimiert. Anderungen in der 
Morphologie und/oder dem Migrationsverhalten, das z.B. 
15 mittels Softagar Assay (Hamburger und Salmon, 1977) oder 
Migrationsassay (Liaw et al; 1995) der B345 
exprimierenden Zellen gegeniiber den nicht-transf izierten 
Zellen deuten auf eine Rolle von B345 in dem dafiir 
verantwortlichen biologischen Prozess hin. Dies ist ein 
20 deutlicher Hinweis auf eine Beteiligung von B345 an der 
Interaktion von Tumorzellen untereinander und/oder mit 
der extrazellularen Matrix und somit auf eine Funktion 
bei der Metastasierung, 

Alternativ bzw. zusatzlich zu dieser Funktionsanalyse 
25 ' wird in einem komplementaren Ansatz die Expression von 
B345 fin Zellen, die dieses Protein endogen exprimieren, 
unterdruckt, um ebenfalls die etwaige Anderungen in 
Morphologie und/oder Migrationsverhalten f est zustellen . 

AuBerdem wird gegebenenf alls untersucht, ob 
30 Proteinkomponenten existieren, die mit B345 inter- oder 
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extrazellular interagieren (z.B. mittels' Yeast Two 
Hybrid System (Fields and Song, 1989) . 

Die Erfindung betrifft somit in einem ersten Aspekt ein 
tumorspezif isches Polypeptid mit der Bezeichnung B345, 
5 mit der in SEQ ID NO: 4 angegebenen Aminosauresequenz 

Oder ein Polypeptid, das von einem Polynukleotid kodiert 
wird, das unter stringenten Bedingungen mit einem 
Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
Oder einer Teilsequenz davon hybridisiert , sowie davon 
10 abgeleitete Proteinf ragmente oder Peptide. 

In einem weiteren Aspekt betrifft die vorliegende 
Erfindung ein isoliertes DNA-Molekul, kodierend fiir das 
tumorspezif ische Polypeptid der Bezeichung B345- 

Bevorzugt ist das erf indungsgemafie DNA-Molekiil ein 
15 Polynukleotid der in SEQ ID NO: 3 dargestellten Sequenz 
Oder ein Fragment davon oder ein DNA-Molekul, das mit 
einem DNA-Molekul der in SEQ ID NO: 3 dargestellten 
Sequenz oder einer Teilsequenz davon unter stringenten 
Bedingungen hybridisiert , oder ein Fragment davon. 

20 Unter ^stringenten Bedingungen^' wird z.B. verstanden: 

Inkubation uber Nacht bei 65°C - 68°C mit 6xSSC (IxSSC = 
150 mM NaCl, 15 mM Tri-Natriumcitrat) , 5xDenhardt's 
^ Losung, 0.2%SDS, 50 pg/ml Lachsspermien-DNA, daran 

anschliefiend Waschen zweimal 30 min mit 2xSSC, 0,1% SDS 
25 bei 65°C, einmal 30 min mit 0.2xSSC, 0.1% SDS bei 65°C 
und gegebenenf alls abschlieftendes Spulen mit O.lxSSC, 
0,1%SDS bei 65*^0, oder aquivalente Bedingungen. 



Die erf indungsgemafien DNA Molekule kodieren fiir 

(Poly) peptide der Bezeichnung B345 mit der in SEQ ID NO: 
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4 dargestellten Aminosauresequenz bzw. fiir davon 
abgeleitete Proteinf ragmente Oder Peptide; damit sind 
DNA Molekiile bzw. Fragmente mitumf asst , die durch die 
Degeneration des genetischen Codes Abweichungen von der 
5 in SEQ ID NO; 3 dargestellten Sequenz aufweisen 

In einer Ausf uhrungsf orm der Erfindung betrifft die 
Erfindung ein isoliertes DNA-Molekul der in SEQ ID NO: 3 
dargestellten Sequenz oder ein Fragment davon, oder ein 
DNA-Molekul, das mit einem DNA-Molekul der in SEQ ID 
10 NO: 3 dargestellten oder mit einer Teilsequenz davon 
hybridisiert , kodierend fiir das natiirliche 
B345-Polypeptid bzw. fiir ein Fragment davon. 

Die B345-DNA-Molekiile konnen in einer sog. DNA-Vakzine 
fiir die Immuntherapie von Tumoren verwendet werden. 

15 Dabei konnen die B34 5-DNA-Molekiile Erfindung, 

vorzugsweise in rekombinanter Form als Plasmide, direkt 
Oder als Bestandteil eines rekombinanten Virus, oder 
Bakteriums verabreicht werden. Prinzipiell kann jede 
gentherapeutische Methode fiir die Immuntherapie von 

20 Krebs auf Basis von DNA ("DNA-Vakzine") auf B345-DNA 
angewendet werden, und zwar sowohl in vivo als auch 
ex vivo. 

Beispiele fiir die in vivo Verabreichung sind die direkte 
Injektion von "nackter" DNA, entweder intramuskular oder 

25 mittels Gen-Pistole ( "gene gun") von der sich gezeigt 
hat, dali sie zur Bildung von CTLs gegen Tumorantigene 
fiihrt. Beispiele fiir rekombinante Organismen sind 
Vaccinia Virus, Adenovirus oder Listeria monocytogenes 
(eine Ubersicht wurde von Coulie, 1997, gegeben) . 

30 Desweiteren konnen synthetische Trager fiir 
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Nukleinsauren, wie kationische Lipide, Mikrospharen, 
Mikrokugelchen oder Liposomen fiir die in vivo 
Verabreichung von Nukleinsaure-Molekulen, kodierend fiir 
B345-Peptid verwendet werden. Ahnlich wie fiir Peptide 
5 konnen verschiedene Hilfsstoffe, die die Immunantwort 
verstarken, mitverabreicht werden, z.B, Zytokine, 
entweder in Form von Proteinen oder dafur kodierenden 
Plasmiden. Die Applikation kann gegebenenf alls mit 
physikalischen Methoden, z.B. Elektroporation, 
10 kombiniert werden. 

Ein Beispiel fiir die ex vivo Verabreichung ist die 
Transfektion dendritischer Zellen, wie von Tuting, 1997, 
beschrieben, oder anderer APCs, die als zellulare 
Krebsvakzine zur Anwendung kommen. 

15 Die vorliegende Erfindung betrifft somit in einem 

weiteren Aspekt die Verwendung von Zellen, die B345 
exprimieren, entweder von sich aus oder, in 
gegebenenf alls modif izierter Form, nach Transfektion mit 
der entsprechend kodierenden Sequenz, fiir die 

20 Herstellung einer Krebsvakzine. 

Alternativ zur natiirlichen B345-cDNA bzw. Fragmenten 
davon konnen modif izierte Derivate verwendet werden - 
Diese umfassen Sequenzen mit Modif ikationen, die fiir ein 
Protein ( fragment ) bzw. Peptide mit starkerer ^ 

0 

25 Immunogenitat kodieren, wobei fiir die Modif ikationen auf 
DNA-Ebene dieselben Uberlegungen gelten wie fiir diej oben 
beschriebenen Peptide. Eine weitere Art der Modif ikation 
ist die Aneinanderreihung zahlreicher Sequenzen, 
kodierend fiir immunologisch relevante Peptide, nach Art 

30 einer Perlenschnur (^"^ string-of -beads" ; Toes et al.. 
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1997) . Die Sequenzen konnen auch durch Anfiigung von 
Hilf selementen modif iziert werden, z.B. Funktionen, die 
eine effizientere Abgabe und Prozessierung des 
Irnmunogens gewahrleisten (Wu et al . , 1995). 
5 Beispielsweise kann durch Anfugen einer 

Lokalisierungssequenz in das endoplasmatische Retikulum 
("ER targeting sequence") die Prozessierung und damit 
die Presentation und letztlich die Immunogenitat des 
Antigens erhoht werden. 

10 Die vorliegende Erfindung betrifft in einem weiteren 
Aspekt ein rekombinantes DNA-Molekul, das B345-DNA 
enthalt, z.B. verbunden mit einer regulatorischen 
DNA-Sequenz, insbesondere einer heterologen 
regulatorischen DNA-Sequenz, z.B. einem Promoter oder 

15 Enhancer. 

Die Erfindung betrifft in einem weiteren Aspekt 
Antikorper gegen B345 bzw. Fragmente davon. Polyklonale 
Antikorper konnen in herkommlicher Weise durch 
Immunisierung von Tieren, insbesondere Kaninchen, 
20 mittels Injektion des Antigens bzw. Fragmenten davon, 

und anschlieftender Reinigung des Immunglobulins erhalten 
werden. 

Monoklonale anti-B345-Antik6rper konnen nach 
Standardprotokollen gemafi dem von Kohler und Milstein, 

25 1975, beschriebenen Prinzip gewonnen werden, indem 

Tiere, insbesondere Mause, immunisiert , anschlieBend 
antikorperproduzierende Zellen der immunisierten Tiere 
immortalisiert werden, z.B. durch Fusion mit 
Myelomzellen, und der Oberstand der erhaltenen Hybridome 

30 mittels immunologischer Standard-Assays auf monoklonale 
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anti-B345-Antikorper gescreent wird. Fur den 
therapeutischen oder diagnostischen Einsatz im Menschen 
konnen diese tierischen Antikorper gegebenenf alls auf 
herkommliche Weise chimerisiert (Neuberger et al,, 1984; 
5 Boulianne et al., 1984) oder humanisiert (Riechmann et 
al., 1988; Graziano et al . , 1995) werden. 

Humane monoklonale anti-B345-Antikorper ( f ragmente) 
konnen auch von sog. ,^Phage Display Libraries" (Winter 
et al,, 1994; Griffiths et al., 1994; Kruif et al., 
10 1995; Mc Guineas et al., 1996) und mittels transgener 

Tiere (Bruggemann et al., 1996; Jakobovits et al., 1995) 
gewonnen werden. 

Die erf indungsgemalien anti-B345-Antikorper konnen in 
immunhistochemischen Analysen* fur diagnostische Zwecke 

15 eingesetzt werden, oder als Therapeutikum in der 
Krebstherapie . (Ein Beispiel fiir die erfolgreiche 
Anwendung eines monoklonalen Antikorpers in der 
Krebstherapie ist Herceptin; ein Antikorper gegen das 
Proto-Onkogen HER2 . Herceptin kann in Brustkrebs- 

20 Patienten angewendet werden, die eine Oberexpression von 
HER2 auf weisen . ) 

In einem weiteren Aspekt betrifft die Erfindung die 
Verwendung von B345-spezif ischen Antikorpern, um 
beliebige Substanzen^ selektiv zu bzw. in einen Tumor zu 

25 bringen, der B345 exprimiert. Beispiele fiir solche 

Substanzen sind zytotoxische Agenzien oder radioaktive 
Nuklide, deren Wirkung darin besteht, den Tumor Vorort 
zu schadigen. Aufgrund der relativ tumorspezif ischen 
Expression von B345 sind dabei nur geringe 

30 Nebenwirkungen zu erwarten. In einem weiteren Aspekt 
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konnen mit Hilfe von B345-Antikorpern Substanzen zur 
Sichtbarmachung von Tumoren, die B345 exprimieren, 
herangezogen warden. Dies ist fur die Diagnose und die 
Bewertung des Therapieverlauf s von Nutzen. 
Therapeutische und diagnostische Anwendungen von 
Antikorpern, die fur anti-B345-Antikorper in Frage 
kommen, sind in der WO 95/33771 beschrieben. 

Das Protein der Bezeichnung B345 gemali der vorliegenden 
Erfindung und die davon abgeleiteten Proteinf ragmente;. 
Peptide bzw. Peptid-Aquivalente oder Pept idomimetika 
konnen in der Krebstherapie eingesetzt werden, z. B. um 
eine Immunantwort gegen Tumorzellen zu induzieren, die 
die entsprechenden Antigen-Determinanten exprimieren . 
Vorzugsweise werden sie fur die Therapie von 
B34 5-positiven Tumoren verwendet, insbesondere beim 
Lungen- und Kolonkarzinom. 

Es ist bekannt, dass tumorassoziierte Antigene 
tumorspezif ische Mutationen aufweisen konnen, die zu 
einer iimnunologischen Unterscheidung zwischen Tumor und 
Normalgewebe beitragen (Mandruzzato et al., 1997; Hogan 
et al., 1998; Gaudi et al., 1999; Wolfel et al.,1994). 
Um das Vorhandensein tumorspezif ischer B345-Mutationen 
f estzustellen, wird, zweckmaflig mit Hilfe von Sonden aus 
der* erf indungsgemalien isolierten cDNA, die B345-cDNA aus 
ednem oder mehreren unterschiedlichen Tumoren kloniert 
und die erhaltenen Sequenzen mit Normalgewebs-B345-cDNA 
verglichen, Es werden Versuche durchgef uhrt , die zeigen 
sollen, ob Tumor-B345-Peptide aus einem gegenuber 
Normalgewebs-B345 mutierten Sequenzabschnitt im 
Vergleich zu Normalgewebs-B345-Peptiden aus dem 
entsprechenden Abschnitt eine verstarkte Immunogenitat 
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aufweisen- Urn zu bestatigen, dass etwaicfe Mutationen 
tumorspezif isch sind, konnen Antikorper gegen diese 
Bereiche generiert und Tumorzellen auf Expression von 
moglichen Mutationen untersucht werden. 

Die vorliegende Erfindung betrifft somit in einem 
weiteren Aspekt B345-Peptide, abgeleitet von Bereichen 
eines tumorexprimierten B345, die tumorspezif ische 
Mutationen aufweisen . 

Auf Grund der bevorzugten Expression von B345 in 
Tumorzellen kann angenommen werden, dass dieses Protein 
eine wichtige Funktion fur den Tumor hat, z.B. fiir 
Entstehung, Infiltration und Wachstum und somit ein 
Target fiir die chemotherapeutische Intervention 
darstellt . 

Im Hinblick auf seinen Einsatz als Target in der 
gezielten Chemotherapie wird B345 naher charakterisiert , 
um die geeignete Strategie fur die Intervention mit 
dieser Funktion zu entwickeln. 

Als ersten Schritt bei der sog. ,,down-"Stream^' 
Funktionsanalyse von B345 fiihrt man zweckmaJiig in einem 
ersten Schritt eine bioinf ormatische Analyse durch, die 
den fiir die experimentelle Validierung von B345 als 
Target richtungweisend ist. 

Fur diese Analyse stellen die auf Ahnlichkeit und 
modularer Struktur beruhenden Bioinf ormatik-Konzepte 
eine wesentliche Grundlage dar. Etablierte 
bioinf ormatische Hilfsmittel zur Feststellung von 
Ahnlichkeiten sind BLAST 

( http: //www. ncbi . nlm. nih. gov/BLAST , Altschul et al.. 
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1997) Oder FASTA (Pearson & Lipman, 1988), die 
spezialisierten Datenbanken wie Pfam 

( http: / /www. Sanger . ac . uk/Pf aiU ;, Bateman et al., 2000) und 
SMART ( http: //smart . embl-heidelberg , de , Schultz et al., 
5 2000), welche Domanenstrukturen berucksichtigen . Zur 
Verfeinerung der Analyse konnen Applikationen wie 
Clustal ( http : //www2 . ebi . ac . uk/clustalw , Higgins et al., 
1996) HMMer ( http://hminer.wustl.edu ) , PSI-BLAST 
(Altschul et al., 1997) und die PROSITE Datenbank 

10 ( http : //www . expasy . ch/prosite , Hofmann et al., 1999) 

herangezogen werden. Statistische Analysemethoden, die 
nicht auf Homologien beruhen, gestatten die Vorhersage 
weiterer struktur- und f unktionsrelevanter Eigenschaf ten 
wie der Sekundarstruktur und des Auftretens von 

15 Transmembransegmenten und Helix-Turn-Helix-Motiven . 
Methoden zur Vorhersage der Sekundarstruktur von 
Proteinen sind verfugbar; besonders erwahnenswert ist 
Jpred ( http : //barton . ebi . ac ■ uk/servers/ jpred . html , Cuff 
et al., 1998). Die Sekundarstrukturvorhersage kann 

20 Funktionshypothesen untermauern, etwa wenn die Struktur 
des vermuteten Homologen bekannt ist. 

GemaU Bioinf ormatikanalyse weist B345 eine helikale 
Transmembrandomane auf, wobei sowohl der N-terminale als 
auch der C-terminale Bereich hydrohpil sind, was darauf 

25 schlielien lasst, dass dieses Protein ein 

Transmembranprotein darstellt, Der N-terminale, 
extrazellulare Bereich besitzt einige CUB-Domanen, 
welche zu Disulf idbriickenbildung neigen und daher bei 
der Dimerisierung bzw. bei Protein -Protein 

30 Wechselwirkungen beteiligt sind (Bork et al., 1993). Das 
C-terminale, intrazellulare Ende zeigt Homologien zu 
einer Rezeptorkinase und zu einem C-Kinase Substrat. 
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In weiterer Folge wird B345 einer biochemischen und 
biologischen Analyse unterworfen. 

In einem nachsten Schritt wird die Funktion von B345 fiir 
das Tumorgeschehen aufgeklart; z.B. durch 
5 Prolif erationsassays in vitro oder in Tiermodellen, die 
das zu untersuchende B345-Gen uberexprimieren 
(konstitutiv oder induzierbar) und als Kontrolle 
entweder in deletierter (inaktiver) Form exprimieren 
Oder liber Antisense hinunteregulieren (siehe z.B. 
10 Grosveld und Kollias, 1992) . 

B345 kann in Screening-Assays verwendet werden^ um 
Substanzen zu identif izieren, die die Aktivitat dieses 
Proteins modulieren, insbesondere inhibieren. In einer 
Ausf uhrungsf orm kann ein derartiger Assay z. B, darin 

15 bestehen, das B345 Protein, oder ein aktives Fragment 
davon, in Zellen, die auf die Aktivitat von B345 mit 
Proliferation reagieren, einzubringen bzw. die 
entsprechende B345 cDNA in der Zelle zur Expression zu 
bringen, und die Proliferation der Zellen in Gegenwart 

20 und in Abwesenheit einer Testsubstanz zu bestimmen. 

Ein Beispiel fur Testzellen sind Zellen mit niedriger 
Teilungsrate , z.B, primare Zellen, die kein endogenes 
B345 aufweisen. Um die Eignung der Zellen fur einen 
Screening-Assay f est zustellen, werden diese mit ^ 

25 B345-CDNA transf ormiert , gezuchtet und mit Standard- 
Assays, z.B, Thymidin-Einbau, auf ihre \ 
Prolif erationsfahigkeit getestet, Aufgrund einer nach 
B345-Expression signif ikanten Erhohung ihrer 
Prolif erationseigenschaft konnen sie als Testzellen 

30 eingesetzt werden, z.B. in High Throughput Screening 
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Prolif erationsassays . Beispiele fur Prolif erationsassays 
im High Throughput Format, z.B. auf Grundlage des MTS- 
Assays, sind in der WO 98/00713 beschrieben. 

Substanzen mit prolif erationshemmender Wirkung konnen 
5 zur Behandlung von Tumoren mit starker B345-Expression 
verwendet werden, insbesondere beim Lungen-und 
Kolonkarzinom. 



Figurentibersicht : 

10 Fig. lA: Expressionsprof il von B345, B452 und B540 in 
individuellen Lungenkarzinomen und 
Lungentumorzelllinien . 

Fig. IB: Expressionsprof il von B345 in normalem 
Dickdarmgewebe und Tumorzelllinien . 

15 Fig. IC: Graphische Darstellung des Alignments von 
B345, B452 und B540. 

Fig, 2A: Northern Blot Analyse der Tumorzelllinie A549 
mit einerri 490bp langem B345 PCR-Produkt 

Fig. 2B: Northern Blot Analyse verschiedener 
20 Normalgewebe mit einem 490bp langem B345 

PCR-Produkt \ 

0 

Fig. 2C: Northern Blot Analyse verschiedener 

I 

Krebsgewebe mit einem 318bp langen B345 
PCR-Produkt 



25 Fig. 
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mRNA Expressionsanalyse von B345 durch 
real-time PGR von Tumor- und Normal-Geweben . 
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Fig. 4: mRNA Expressionsanalyse von B34 5 durch 

real-time PGR von Laser-Mikroskop-praparierten 
Dickdarmtumoren (LCM) sowie normalem 
Dickdarmgewebe und Tumorzelllinien . 

5 Fig. 5: Graphische Darstellung der Genstruktur von 
B345. 

Fig. 6: Hydrophilizitats-und Transmembran-Blot des 
B345-Proteins 

Fig. 7: Potentielle Proteinstruktur von B345 
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Tabellenlibersicht 

Tab. 1: Zusammenf assung der Northern Blot Daten von 
B345 in verschiedenen Normalgeweben (lA) , 
15 Krebszelllinien (IB); und verschiedenen 

Normalgeweben im Vergleich mit dem 
entsprechenden Tumorgewebe (IC) 

Tab. 2A: Zusammenf assung der Daten der quantitativen 
PGR von B345 in verschiedenen Normal- und 
20 Krebsgeweben 

Tab. 2B: Zus^ammenf assung der Daten der quantitativen 

PGR von B345 in verschiedenen Normalgeweben 

I 

und mikrodissektierten Kolonadenokarzmom 
Geweben 
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Zeichenerklarung 
+++ extrem positiv 

++ stark positiv 

+ positiv 
5 (+) schwach positiv 

negativ 

Beispiel 1 

- RDA Representational Difference Analysis'') von der 
10 humanen Adenokar zinom-Zelllinie der Lunge (A54 9) und 
normalem Lungengewebe 

Die von ATCC bezogene humane Lungenadenokarzinom- 
Zellinie A549 (CCL 185) wurde in T150 Zellkulturf laschen 
hochgeztichtet . Als Nahrmedium diente MEM mit 10% hitze- 

15 inaktiviertem, fotalem Kalberserum und 2 mM L-Glutamin. 
Alle 3 bis 4 Tage wurden die Zellen durch Trypsinisieren 
1:5 bis 1:10 zur Propagation gespalten. Nach Erreichen 
von etwa 80% Konfluenz wurden pro T150 Zellkulturf lasche 
4 ml einer Trypsinlosung (Angaben pro Liter: 8g NaCl, 
.20 0,2g KCl, l,13g Na2HP04-wasserf rei, 0,2g KH2PO4, 

100ml 2,5% Trypsinlosung, Ig EDTA-Na-Salz ; pH 7,2 - 7,4) 
zum Ernten der Zellen eingesetzt- Die 4 ml wurden in ein 
15 ml Falconrohrchen transf eriert , mit 8 ml PBS 
versetzt, bei 1200 rpm in einer Haereus Tischzentrif uge 

25 (Megafuge 2. OR) 5 min bei 4°C zentrif ugiert , das 

Zellpellet mit 1 ml Lysis-Puffer (lOmM Tris-HCl pH8, 
140mM NaCl, 1,5 mM MgCl2/ 0,5% NP40) versetzt, kraftig 
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geschuttelt und in einem 2 ml Eppendorf gef ali bei 
12 000 rpm und 4°C 5 min in einer Sigma Tischzentrif uge 
(Sigma 202 MK) abzentrif ugiert . Der Uberstand wurde in 
ein neues Eppendorf gef aft transferiert und nach Zusatz 
5 von 55 \il 20% SDS-Losung zweimal mit dem doppelten 
Volumen an einer CHCla/Phenol (1:1 v/v) Mischung und 
einmal mit dem einfachen Volumen an CHCI3 extrahiert. Die 
wassrige RNA-enthaltende Phase wurde mit 1/10 Volumen an 
3M NaAc (pH5) und dem zweifachen Volumen an 96% EtOH 

10 versetzt und uber Nacht bei -20°C die RNA prazipitiert , 
Ausgehend von 1 mg Gesamt-RNA wurde fur die Isolierung 
von poly-A(+)RNA mittels des PolyATtract Kit (Promega) 
entsprechend dem Hersteller-Protokoll vorgegangen. Die 
Lagerung der A549 poly-A(+)RNA mit einer Konzentration 

15 von 1 mg/ml in DEPC-behandeltem H2O erfolgte in Aliquots 
bei -80°C. 

Zur Durchfuhrung der reprasentativen Dif f erenzanalyse 
(RDA; Hubank and Schatz, 1994; Diatchenko et al., 1996) 
wurde die poly-A(+)RNA der Lungenadenokarzinom-Zellinie 

20 A549 als ^tester""', die von normalem Lungengewebe 

(1 mg/ml; Clontech, Palo Alto; #6524-1) als ^driver"' 
eingesetzt- Die RDA wurde unter Verwendung des 
PCR-select™ kit (Clontech, Palo Alto) entsprechend dem 
Hersteller-Protokoll durchgef iihrt , mit der Ausnahme, 

25 dass ein modif iziertes Primer/Adaptor-2- 

Oligonukleotidsystem zum Einsatz kam: Adaptor-2-alt-l 
(SEQ ID NO: 31) und nested-PCR-primer-2-alt 

(SEQ ID NO: 32) und Adaptor-2-alt-2 (SEQ ID NO: 33) . Die 
neu generierten Primer/Adaptor-Sequenzen ermoglichen 
3 0 durch die Anwesenheit von drei neuen 

Restriktionsenzymschnittstellen (Kpn I, Sac I und Xho I) 
in der Sequenz des nested-PCR-primer-2-alt nach 
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Klonierung der subtrahierten cDNA- Fragments in den 
pPCRII-Vektor ein nachtragliches Herausschneiden der 
jeweiligen cDNA-Fragmente . Das Designen einer 
Primer/Adaptorsequenz mit mehreren verfugbaren 
5 Restriktionsenzymschnittstellen war deshalb notwendig, 
well besonders in den Primersequenzen - bedingt durch 
die PCR-Amplif ikationsschritte- oft Punktmutationen zu 
beobachten waren. 

Nach der Synthese von doppelstrangiger cDNA mittels 

10 oligo-dT wurde die erhaltene cDNA von ^tester" und 
„driver^^ mit Rsal verdaut (Rsal ist ein 4-Basen 
erkennendes Restriktionsenzym und liefert im 
statistischen Mittel 256 bp lange cDNA-Fragmente) . 
Gleiche Teile von ,,tester-cDNA" wurden entweder mit den 

15 Adaptoren 1 oder 2 ligiert und anschliefiend getrennt mit 
einem Uberschuss an ,,driver-cDNA"' bei 65°C hybridisiert . - 
Danach wurden die beiden Ansatze vereinigt und einer 
zweiten Hybridisierung mit frischer denaturierter 
„driver-cDNA" unterworfen. Die angereicherten ^^tester''- 

20 spezifischen cDNAs wurden anschlieftend durch PGR, mit 
fiir die Adaptoren 1 bzw. 2 spezifischen Primern, 
exponentiell amplif iziert . Fiir eine weitere Anreicherung 
wurde ein Aliquot dieser Reaktion einer zweiten PGR mit 
spezifischen nach innen versetzten (,, nested") Primern 

25 unterworfen. Die aus dieser Reaktion resultierenden, 

exponentiell amplif izierten cDNA-Fragmente wurden direkt 
in den pCRII-Vektor (Invitrogen; „TA-cloning vector^^ ) ^' 
ligiert und anschliefiend ein Drittel des 
Ligationsansatzes in kompetente E. coli (OneShot™, 

30 Invitrogen) transf iziert . 
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712 positive Transf ormanten (Blau-Weili-Selektion) wurden 
erhalten und in 96-Napf Blocken in LB-Amp Medium (1,3 ml 
pro Napf) fur 48 h bei 37°C kultiviert. Pro Napf wurden 
750 pi der E. coli Suspensionen fur die Praparation der 
5 Plasmid-DNA eingesetzt (96-Napf- Minipraparationsmethode 
von QIAgen nach Vorschrift des Herstellers) . Die 
verbleibenden Bakterienkulturen wurden als 
Glycerinstammkulturen bei -80**C gelagert, 

Es wurde eine aus 712 Einzelklonen bestehende cDNA- 
10 Subtraktionsbibliothek erhalten, die sowohl in Form von 
E, coli Glycerin-Stammkulturen als auch in Form 
gereinigter Plasmide vorlag. 

Beispiel 2 

15 DNA-Sequenzierung und Annotation von TAA-Kandidaten 

Die isolierte Plasmid-DNA samtlicher 712 Klone (siehe 
Beispiel 1) wurde nach der Sanger-Methode auf einem 
ABI-377 Prism Gerat sequenziert. Die erhaltenen 
Sequenzen wurden mittels der BioScout-Sof tware (LION, 

2 0 Heidelberg) annotiert und Datenbankvergleichen (Genbank) 
unterzogen. Von 712 Klonen konnten 678 sequenziert und 
annotiert werden. Der Rest (34) wies als Insert entweder 
nur poly (A) Sequenzen auf Oder entsprach einem 
religierten Vektor oder war nicht sequenzierbar . Von den 

25 678 annotierbaren Sequenzen erwiesen sich 357 als Gene 
mit bekannter Funktion. Die restlichen 
321 reprasentierten Klone, kodierend fur Gene mit 
unbekannter Funktion; 59 davon wiesen nicht einmal 
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Eintrage in der humanen EST-Datenbank aiif . Bekannte Gene 
wurden nicht weiter behandelt. Fiir jene unbekannten 
Gene, fiir die ein EST-Eintrag verfligbar war, wurde eine 
Abschatzung des Expressionsprof ils vorgenommen : dabei 
5 wurden all jene ESTs mit > 95% Identitat (BLAST) , die 
zur entsprechend experimentell ermittelten Sequenz der 
Subtraktionsbibliotheken gehorten, iiberpriift. Bei der 
Annotation wurde eine Unterteilung in a) kritische 
Normalgewebe, b) fotale, " verzichtbare " und 

10 immunprivilegierte Gewebe und c) Tumor e und Tumor- 

Zellinien vorgendmirten . Auf der Basis dieses "virtuellen 
inRNA-Prof ils " ("virtueller Northern blot") wurden 
2 00 Klone, fiir die keine ESTs in der Gruppe a) gefunden 
wurden, fiir weiter e experimentelle Analysen ausgewahlt 

15 (inklusive der 59 Klone, fiir die keine EST-Eintragung 
vorlag) . Zur weiteren Einengung der Kandidatenklone 
wurden aus den von den 2 00 ausgewahlten Klonen 
ermittelten Sequenzen Oligonukleotidprimerpaare 
entworfen und synthetisiert . Es wurden zunachst 

2 0 8 verschiedene, von humanem Gewebe abgeleitete 

cDNA-Bibliotheken (GibcoBRL "SUPERSCRIPT™") , welche 
direktional in pCMV-SPORT kloniert sind, mittels 
qualitativer PGR auf das Vorhandensein der jeweiligen 
Kandidaten getestet. Die- dabei eingesetzten 

25 cDNA-Bibliotheken stammten aus Gewebe von Herz 
(#10419-018), Leber (#10422-012), Leukozyten 
(#10421-022), Niere (#10420-016), Lunge (#10424-018), 
Testis (#10426-013), Gehirn (#10418-010) und fotalem 
Gehirn (#10662-013) . Die PCR-Bedingungen waren wie 

30 folgt: 20 \il Gesamtvol\imen pro PCR-Ansatz enthielten 
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1 X TaqPol-Puf fer {50mM KCl, 10 mM Tris-HCl pH9, 
0,1% Triton X-100) , 1,5 mM MgClj, 0,2 mM dNTPs { Pr omega ) , 
0,025 U/]jil Taq-DNA-Polymerase { Pr omega ) , jeweils 5 pM an 
spezifischen Oligonukleotidprimer flir B345 (B345-D, 
SEQ ID NO: 34) und (B345-U, SEQ ID NO: 35) sowie 100 ng 
der jeweils zu untersuchenden Plasmid-DNA, Zur Kontrolle 
wurden spezifische Primer fur GAPDH (SEQ ID NO: 3 6 und 
37) eingesetzt. Zur Uberprlifung des selektiven 
Nachweises wurden die jeweiligen B345 spezifischen 
Primerpaare Oligonukleotidprimer (SEQ ID NO: 34) und 

(SEQ ID NO: 35) parallel auch auf das isolierte Plasmid 
mit dem B345 "original Fragment" hin ausgetestet 

(urspriinglich isoliertes cDNA-Fragment von B345) . Die 
Nachweisbarkeit von. Fragmenten der zu erwartenden Lange 
mit starkem Signal in einem der kritischen Normalgewebe 

(Herz, Leber, Lunge, Niere und Leukozyten) , nicht jedoch 
in den cDNA-Bibliotheken aus immunprivilegierten Geweben 

(Gehirn, fotales Gehirn und Testis) unter diesen 
PCR-Bedingungen (1 Zyklus : 3' 94°C; 3 5 Zyklen: 1' 94°C - 
1' 55°C - 1' 72°C; 1 Zyklus: 7' 72°C) wurde als 
Ausscheidungskriterium definiert. Mittels dieser 
qualitativen PCR-Analyse konnte die Zahl der Kandidaten 
auf 56 eingeengt werden; Klon B345 befand sich in dieser 
bereits vo^rselektionierten Kandidatengruppe . 
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Beispiel 3 

Expressionsanalyse durch cDNA Chip Hybridisierung 

Fur das Design eines cDNA Chips wurden von der dBEST 
Datenbank liber Nukleotid-Sequenzsuche eine Reihe von 
5 Klonen ausgewahlt, die zu verschiedensten 

Funktionskategorien, wie Apoptose bis zur Zellzyklus- 
Regulation, gehoren. Ingesamt wurden 1299 IMAGE Klone 
(davon reprasentieren 1024 bereits bekannte Gene) 
>r ^i^ bestellt und zur Kontrolle sequenziert. 

10 Mikrotiterplatten mit Bakterien, die ca. 800 bp lange 
Sequenzen vom 3 ' Ende des Gens im Vektor enthalten, 
wurden an Incyte Pharmaceuticals, Inc. (USA) geschickt 
und diese dort auf 60 Chips gespottet . Neben diesen 
Klonen wurden auch 12 0 durch RDA identif izierten EST 
15 Klone auf die Chips gespottet. Die so produzierten DNA 
Chips wurden anschlieSend mit Cy3 markierter cDNA aus 
Normalgewebe, Tumorgewebe und Zelllinien zusammen mit 
Cy5 markierter cDNA aus einer Mischung von neun 
verschiedenen Normalgeweben hybridisiert und die beiden 
2 0 Signale zur Normal is ierung der Expressionswerte 

verglichen. Die Berechnungen erfolgten teilweise in 
S-Plus Oder in Microsoft Excel . Die Auswertung der Chip 
Experimente ergab ein sehr ahnliches Expressionsprof il 
fiir B345, B540 und B452 bei der Hybridisierung mit 
2 5 Lungenkrebs Proben von Zelllinien und Patientenmaterial 
(Siehe Fig. lA) . Solch ein tumorassoziiertes 
Expressionsprof il konnte fiir B345 auch bei Vergleich von 
Kolon Adenokarcinom mit Kolon Normalgewebe gezeigt 
werden (Siehe Fig. IB) . 
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Das Sequenzalignment von B345, B540 und B452 zeigte 
eindeutig ein Uberlappen der einzelnen EST Fragmente. 
Daher konnte man annehmen, dass es sich bei den drei 
Klonen um ESTs von ein und dem selben Gen handelt. Der 
5 daraus resultierende DNA Abschnitt deckt eine Lange von 
843 bp ab (Siehe Fig. IC) und wurde in weiteren 
Versuchen zur Durchsuchung von offentlichen Datenbanken 
verwendet . Die Suchergebnisse lieferten keine 
signifikante Homologie zu bekannten DNA bzw. Protein 
10 Sequenzen, was darauf hindeutet, dass es sich bei B345 
um ein bis lang unbekanntes Gen handelt. 



Beispiel 4 

Expressionsanalyse von B345 mittels Northern Blots 

15 Bei B345 handelt es sich um ein Gen, das laut DNA Chip 
Analysen in Tumorgeweben (siehe Fig. lA und IB, Tab. la 
und Tab. IB) hochreguliert ist. 

^ 1 Um einerseits das erhaltene Transkriptionsprof il zu 

bestatigen und andererseits die Lange der zu erwartenden 
20 mRNA ftir die full size Klonierung zu bestimmen, wurde 
fur B345 eine Northern Blot Analyse unter Einsatz von 
humanen Zelllinien und des "Human Multiple Tissue 
Northern Blots" (Clontech und Invitrogen) durchgef iihrt . 
Als Sonden dienten die mit [a-^^P]dCTP (NEN, Boston) 
25 markierten 490 bp bzw. 318bp langen PGR Produkte von 

B345 (Primer (SEQ ID NO: 5 und SEQ ID NO: 6 bzw. SEQ ID 
N0:7 und SEQ ID NO : 8 ) ) . Die Hybridisierung erfolgte bei 
68° fiir 2 h; die Visualisierung durch Standard- 



Autoradiograf ie (Hyperfilm, Amersham) . Fig. 2A, 2B und 
2C sowie Tab. la und Tab. IB, IC zeigen das Ergebnis 
dieser Analyse: Fig. 2A von der Zelllinie A549, Fig. 2B 
von 12 Normalgeweben (Periphere Blut Lymphozyten (PBL) , 
Lunge, Placenta, Diinndarm, Leber, Niere, Milz, Thymus, 
Kolon, Skelettmuskel, Herz und Hirn) und Fig. 2C von 
8 Krebszelllinien ( Promyelozytische Leukamie HL60, 
HeLa-S3, chronische myelogene Leukamie K-562, 
lymphoblastische Leukamie MOLT-4, BurkittVs Lymphom 
(Raji), Kolon Adenokar zinom SW480, Lungen Adenokarzinom 
A549 und Melanom G361) . Das B345-Transkript zeigt eine 
Lange von 6,5 kb. 

Beispiel 5 

Analyse des Expressionsprof ils von B345 auf RNA-Ebene 
mittels quantitativer RT-PCR (real time PGR oder 
TaqMan-Analyse ) 

Urn eine exaktere Quantif izierung der mRNA Expression in 
den verschiedenen normal und Tumorgeweben durchzuf iihren, 
wurde die "real time PGR" angewandt, die es erlaubt die 
RNA Konzentration im Vergleich zu einen externen 
Standard zu berechnen. 

Die Isolierung der RNA aus Gef riergewebe erfolgte mit * 
Trizol gemaS dem Herstellerprotokoll von Gibco . Zur ^ 
Entfernung von etwaig kontaminierender DNA wurde die 
praparierte RNA wie folgt mit DNAase I verdaut : 3 yg 
Gesamt-RNA wurden mit 20 yl 5x AMV Puffer (Promega) , 
1 yl RNasin (Promega) und 2 |il DNase I (Boehringer 
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Mannheim) in einem Gesamtvo lumen von 80 ul 15 Minuten 
bei 37^C inkubiert. 120 yl Phenol : Chloroform : 
Isoamylalkohol (25:24:1) wurden zugegeben, auf einem 
Vortexer gemischt und kurz abzentrif ugiert . Die wassrige 
5 Phase wurde abgenommen, mit 12 0 ul Chloroform: 
Isoamylalkohol (24:1) versetzt und wie vorher 
zentrifugiert . Die gereinigte RNA wurde Ethanol-gef all t 
und in Wasser gelost. 

AnschlieSend wurde die Gesamt-RNA mit reverser 
10 Transkriptase (Superscript, Gibco, BRL) in cDNA 

\imgeschrieben: Zu 3 ug Gesamt-RNA wurden 1 ]il Oligo dT 
primer (Promega) zugegeben und mit Wasser auf ein 
Endvolumen von 10 ]al gebracht . Nach einer Inkubation von 
5 Minuten bei VO'^C wurde die Losung 5 Minuten bei 
15 Zimmertemperatur abgekuhlt. 5 \il RT reaction buffer (5x, 
Gibco, BRL) , 2,5 lal dNTPs (je 10 mM, Boehringer 
Mannheim), 1 pi RNasin (lOU/ial, Promega), 1,5 ]il 
Superscript (10 U/yl, Gibco, BRL) und 5 \il Wasser wurden 
zugegeben und 1 Stunde bei 42 °C inkubiert und die 
2 0 Reaktion durch Inkubation von 3 Minuten bei 95°C 
beendet , 

Zur Herstellung eines cDNA-pools eines bestimmten Gewebe 
Oder Tumortyps wurden 3 bis 10 verschiedene 
Einzelpraparationen von unterschiedlichen Patienten in 
25 gleichen Anteilen gemischt. I 

Die quantitative Bestimmung der "Haushaltsgene" S-Aktin, 
GAPDH und Tubulin in cDNA-pools wurde wie folgt 
durchgef lihrt : 
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A) S-Actin-TaqMan PGR (Perkin Elmer) 

Details uber das Prinzip der TaqMan Methode siehe 
Herstellerinf ormation (Perkin Elmer) . Ein TaqMan PGR 
Lauf beinhaltete Proben an B-Actin-Kontrollsequenz mit 
5 je 10^, 10^ lOS 10^ und 10^ Kopien/pl (Perkin Elmer) zur 
Bestimmung der Standardkurve, eine Negativkontrolle ohne 
DNA und die zu quantif izierenden cDNA-pools . Alle Proben 
wurden in Triplikaten analysiert. Fur einen 25 pi 
Reaktionsansatz wurden 1 ]il cDNA, 2,5 pi lOx Puffer A 
10 (Perkin Elmer), 4 pi MgGl2 (25 mM, (Perkin Elmer)), 
0,5 pi je Nukleotid (10 mM dATP, dCTP, dGTP; 20 mM 
dUTP) , 0,125 pi TaqMan Sonde (20 pM; TaqMan Sonde fur 
fi-Aktin (SEQ ID NO: 20f luoreszenzmarkiert am 5'-Ende mit 
6-Garboxyf luorescein und mit 
15 6-Garboxytetramethylrhodamine am S'-Ende), 1 pi je 

li-Aktin spezifischer Primer (je 20 pM, Forward Primer 
SEQ ID NO: 21 und Reverse Primer SEQ ID NO: 22), 0,25 pi 
AmpErase uracil N-Glycosylase "UNG" (1 U/pl, Perkin 
Elmer), und 0,125 pi AmpliTaq Gold (5 U/pl, Perkin 
20 Elmer) gemischt, in MicroAmp Optical Tubes (Perkin 
Elmer) uberfiihrt und mit MicroAmp Optical Caps 
^' verschlossen . Die PGR wurde f olgendermaiien durchgef uhrt : 

ein Zyklus mit 2 Minuten 50°G fur die UNG Reaktion, ein 
Zyklus 10 Minuten 95°G zur Aktivierung der AmpliTaq, 
25 40 Zyklen mit je 15 Sekunden 95'' und 1 Minute 60°C. 

Anschlieftend wurden die Proben auf 25 °G gehalten. Die 
Auswertung der Daten erfolgt mit dem Programm "Sequence 
Detection System 1.5bl" (PE Applied Biosystems) , wobei 
im Prinzip die Fluoreszenzsignale der zu 
30 quantif izierenden cDNA-Proben mit den Signalen der 
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Kontrollplasmidverdiinnungen bekannter Konzentration 
verglichen wurden. 

B) GAPDH-TaqMan PGR 

Ftir die Quantif izierung von GAPDH, das wie S-Aktin oder 
5 Tubulin zur Normal isierung der eingesetzten RNAs 
verwendet wurde, sind folgende Primer bzw. Sonden 
eingesetzt worden. Als TaqMan Sonde fiir GAPDH diente 
(SEQ ID NO: 23) eine am 5'-Ende mit 
Tetrachlorf luorescein und am 3'-Ende mit 
10 Garboxymethylrhodamin markierte Sonde (Forward GAPDH 
Primer: SEQ ID NO: 24 und Reverse Primer: SEQ ID 
NO: 25). Die Reaktionen wurden wie oben beschrieben 
dur chge f iihr t . 

C) Tubulin-SybrGreen PGR (Perkin Elmer) 

15 Prinzip der SybrGreen PGR siehe Herstellerinf ormation 
(Perkin Elmer) . Eih SybrGreen PGR Lauf beinhaltete 
Proben an Tubulin-Kontrollplasmid mit je 10^, 10^, 10^, 
10^ und 10^ Kopien/pl (Perkin Elmer) zur Bestimmung der 
Standardkurve, eine Negativkontrolle ohne DNA und die zu 

20 quantif izierenden cDNA-pools. Alle Proben wurden in 

Triplikaten analysiert. Fur einen 25 lal Reaktionsansatz 
* 

wurden 1 ]il cDNA, 2 , 5 yl lOx SybrGreen Puffer (Perkin 
Elmer), 3 , 5 yl MgGl2 (25 mM, Perkin Elmer) ), 0,5 yl je 
Primer (je 2 0 yM, Perkin Elmer, Tubulin Forward (SEQ ID 
25 NO: 26); Tubulin reverse (SEQ ID NO: 27), 0,25 yl AmpErase 
uracil N-Glycosylase "UNG" (1 U/pl , Perkin Elmer), und 
0,25 pi AmpliTaq Gold (5 \J/]il, Perkin Elmer) gemischt, 
in MicroAmp Optical Tubes (Perkin Elmer) uberfiihrt und 
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mit MicroAmp Optical Caps verschlossen. Die PGR wurde 
f olgendennafien durchgef lihrt : ein Zyklus mit 2 Minuten 
50°C fiir die UNG Reaktion, ein Zyklus 10 Minuten 95°C 
zur Aktivierung der AmpliTaq, 40 Zyklen mit je 15 
5 Sekunden 95*^ und 1 Minute 60^C. AnschlieSend wurden die 
Proben auf 25^C gehalten. Die Auswertung der Daten 
erfolgt mit dem Programm "Sequence Detection System 
1 . 5bl " (PE Applied Biosystems) , wobei im Prinzip die 
Fluoreszenzsignale der zu quantif izierenden cDNA-Proben 
10 mit den Signalen der Kontrollplasmidverdiinnungen 
bekannter Konzentration verglichen wurden. 

D) B345-TaqMan PGR 

Die quantitative TaqMan- PGR- Analyse von B345 wurde^ wie 
fiir die "Haushaltsgene" beschrieben, durchgef iihrt . Es 
15 wurden jedoch B345 spezifische Primer (SEQ ID NO: 28 und 
SEQ ID NO:29) (200 ng/pl) und eine B345 spezifische 
Sonde (SEQ ID NO: 30, 2 0 uM) , die am 5'-Ende mit 

Tetrachlorf luorescein und am 3^-Ende mit 
Garboxymethylrhodamin markiert ist, veirwendet. Als 
2 0 Standard wurde das PGR Produkt von B345 mit den Primern 
SEQ ID NO: 2 8 und SEQ ID NO : 2 9 mit bekannter Kopienzahl 
eingesetzt . 

Fig. 3 veranschaulicht die TaqMan- Expressionsanalyse 
(Fig. 3A: S-Actin; Fig. 3B: Tubulin). Es zeigte sich, 
2 5 dass B345 hoher in Dickdarmkrebsgewebe als in 

Normalgewebe exprimiert ist (siehe Tab. 2a). Nun stellt 
aber sowohl das Normalgewebe als auch das Tumorgewebe 
ein sehr heterogenes Gemisch von verschiedenen Zelltypen 
dar. Weiteres variiert der Anteil von Tumorzellen im 
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Tumorgewebe sehr stark von etwa 30 bis 80%. Um diese 
biologische Heterogenitat auf ein Minimum zu 
beschranken, wurden die Epithelzellen des Dickdarms, die 
die Ursprungszellen des Adenokarzinoms darstellen, und 
5 die Krebszellen oder Krebsareale durch Laser- 

Mikrodissektion spezifisch prapariert. Gewebeschnitte 
von lOvun Starke wurden mit dem Kyromikrotom von Leica, 
Jung CM1800 angefertigt und auf einen mit Polyethylen 
beschichteten Objekttrager aufgebracht (Bohm et al . , 
^ 10 1997) . Die bei Raumtemperatur fur etwa 30 Minuten 

getrockneten Schnitte wurden mit Mayers Hamatoxylin 
(SIGMA DIAGNOSTICS) inkubiert und anschliefiend zur 
Entfernung von unspezifisch gebundenen Farbstoff funf 
Minuten unter flieSendem Wasser gewaschen. Nach fiinf 

15 miniitigem Trocknen bei 3 7°C wurde die Laser- 
Mikrodissektion durchgef iihrt . Dafiir wurde das 
Lasermikroskop von PALM (PALM GmbH, Bernried, 
Deutschland) eingesetzt und etwa 2000 bis 5000 Zellen 
prapariert. Die durch Reverse Transkription gewonnene 

2 0 cDNA, wurde auch hier durch Real Time PGR analysiert. 
^ Das Ergebnis zeigt, dass die B345 Expression in 

Dickdarmkarzinom Zelllinien sowie in Patientenmaterial 
um ein Vielfaches hoher ist als vergleichsweise die des 
Dickdarmnormalgewebes . Zur Normal isierung wurde der 

25 Expressionslevel von GAPDH bestimmt (siehe Fig. 4 und 

Tab. 2B) . / 
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Beispiel 6 

a) Klonierung der cDNA von B345 

Das Durchsuchen von Datenbanken nach Sequenzen von 
Genf ragmenten (ESTs, expressed sequence tags) , die fur 
5 die ,,in silico^^ Klonierung von B345 herangezogen werden 
konnen, ergab ein iiberlappendes EST-Kontig von etwa 
1500 bp. Der polyA-Bereich an einem der Enden gab 
Hinweis auf die Orientierung des DNA Abschnittes in 
Bezug auf 5 ^ - 3 ^ Orientierung, was beim Design von 
10 neuen Primern fur die Amplif ikation von B345- 
spezifischen cDNA-Fragmenten essentiell ist. 

Zunachst wurde das durch die Datenbankanalyse 
beschriebene potentielle 3^ Ende durch experimentelle 
Ansatze verifiziert. RNA von der Lungen-Karzinom 
15 Zelllinie Calu 6 (AACC No. HTB56) wurde mit Hilfe des 
Primers (SEQ ID NO: 9) revers transkribiert und die 
resultierende einzelstrangige cDNA wurde mittels PGR mit 
den Gen spezifischen Primer SEQ ID NO: 5 und den 
Adapterprimer SEQ ID NO: 10 amplif iziert . 

2 0 Fur einen 2 5 pi PGR Ansatz wurden 1 ]xl des cDNA-pools 

mit 2,5 ]il lOxTaq Puffer (Promega), 1,5 pi MgClj (25 mM, 
Promega) , 0,5 pi dNTPs (je 10 mM, Boehringer Mannheim), 
1 pi Primermischung (je 20 pM) , 0,15 pi Taq Polymerase 
(Promega) in Wasser gemischt. Die PGR wurde wie folgt 

2 5 durchgefiihrt : Ix 94°C 3 Minuten; 3 Ox 94°C 3 0 Sekunden, 

55°C 3 0 Sekunden, 72°C 1 Minute; auf 4°G halten. Die PGR 
wurde auf einem 1,2% Agarosegel analysiert. 
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Die beiden Primer wurden anschlielJend zum Sequenzieren 
des gereinigten PGR Produktes verwendet. Die ermittelten 
Sequenzen zeigten sine hohe Homologie mit dem „in 
silico^' klonierten DNA Abschnitt (inklusive des PolyA- 
5 Trakts) . 

Da das Klonieren von 5 ' -Endsequenzen einen meist sehr 
aufwendigen Prozess darstellt, wurden im Folgenden zur 
Losung des Problems verschiedene Methoden angewandt - 

Als Ausgangszelllinie wurde auch hier Calu 6 verwendet. 

10 Nach der reversen Transkription der RNA mit dem Primer 
SEQ ID NO: 9 und der Zweitstrangsynthese wurde an die 
Doppelstrang-cDNA ein Linker bestehend aus den beiden 
Oligos SEQ ID NO: 11 und SEQ ID NO: 12 ligiert (Abe et 
al., 1992). Die daraus resultierende LoneLiriker cDNA 

15 Bibliothek wurde dann mit dem Gen spezifischen Primer 
SEQ ID NO: 6 linear liber 35 Zyklen amplif iziert . Ein 
Aliquot der B345 angereicherten cDNA konnte anschliefiend 
mit den Primern SEQ ID NO: 13 und LLEcoRIA SEQ ID NO: 11 
welter amplifiziert werden. Nach der Gelelektrophorese 

20 eines Aliquots und Southernanalyse mit dem 

genspezif ischen Oligo SEQ ID NO: 14 konnte eine 5 kb 
Bande lokalisiert werden. In weiterer Folge wurde dieses 
Fragment schrittweise sequenziert und auf die Sequenz 
des EST-Kontigs ausgerichtet ("aligned"). 

/ 

2 5 Um die resultierende Sequenz aus der LLcDNA Klonxerung 

zu liberprufen, wurden zwei Fragmente mittels PGR (SEQ ID 
NO: 15 und SEQ ID NO: 16 bzw. SEQ ID NO : 6 und SEQ ID 
NO: 17) amplifiziert und fiir das Screenen von Lambda gtlO 
cDNA Phagen Bibliotheken eingesetzt. Positive Plaques 

30 wurden isoliert und mittels den gtlO spezifischen 
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Primern (SEQ ID NO: 18 und SEQ ID NO: 19) PGR 
amplif iziert . AnschlieBende Sequenzierung und das 
Alignment itiit den Sequenzen fiihrte zu der Annahme, das 
es sich hierbei urn ein dif f erenzielles SpleiSprodukt 
5 handelt. Die Splei&donor, Akzeptor und Lariatsecjuenz 
konnten in weiterer Folge gefunden werden. Mittels PGR 
durch geeigneter • Primerkoinbi nation wurde in 
verschiedenen Zelllinien nach dif f erenziellen 
SpleiSprodukten gesucht, wobei in alien gescreenten 

10 Zelllinien nur ein Produkt gefunden wurde und zu der in 
Fig. 5 dargestellten Genstruktur fuhrte. Die angefiihrte 
cDNA besitzt einen offenen Leserahmen (ORF) der fiir ein 
potentielles Protein mit einer Lange von 749 Aminosauren 
kodiert. Die Translationsinitiationsstelle an 

15 Position 215 entspricht zu etwa 75% einer Kozak- 

Konsensussequenz , Die in diesem Experiment erhaltenen 
Ergebnisse veranlassten dazu, in einem weiteren 
Experiment (Beispiel 6b) die 

Transkriptionsinitiationsstelle noch exakt durch Primer- 
20 Extension zu bestimmen, um sicher zu gehen, dass das 
hier ermittelte 5' Ende das tatsachliche 5'-Ende von 
B345 ist. Die von der in diesem Klonierungsversuch 
erhaltenen cDNA (SEQ ID N0:1) abgeleitete 
Aminosauresequenz' von B345 ist in SEQ ID NO : 2 gezeigt. 

25 b) Zweiter Klonierungsversuch; Bestimmung der 5^-und 
der Promotbrregion von B345 

Mit Hilfe des Promoter Finder DNA Walking Kit (Clontech) 
und anschlieliender Primerextension Reaktion wurden die 
5 ^-Region und die Promotorregion sowie die exakte 
30 Transkriptionsinitiationsstelle bestimmt. Die 5 '-Region 
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wurde mit Hilfe einer genomischen DNA Library von 
Clontech mit B345 spezifischen Primern (SEQ ID NO: 38 
bzw. nested SEQ ID NO: 39) und Adaptor Primer im Kit 
amplif iziert - Um den exakten Transkriptionsstart zu 
5 bestimmen, wurde die Primer Extension Reaktion 

durchgefuhrt . . Dafur wurde der Primer SEQ ID NO: 40 am 
5'-Ende mit Hilfe 10 U der T4 Polynukleotid Kinase 
(Promega) und 3iil [y-^^PJATP (3000Ci/mmol) nach Standard- 
Protokollen markiert (Sambrook et al., 1989). Das 
10 markierte Oligonukleotid wurde durch Prazipitation 
gereinigt. Fur die Primerextension Reaktion wurden 
; 10.000 cpm Oligonukleotid in einem Gesamtvolumen von 
20 pi zu 25 pg Total RNA der Colo 205 Zelllinie 
(ATCC : CCL-222 ) eingeset zt . 

15 Die RNA der Zelllinie wurde mit dem radioaktiv 

markiertem Primer revers transkribiert und auf ein 
10%- Polyacryamidgel aufgetragen. Zur Bestimmung der 
genauen Bandenlange wurde ein PGR Fragment von 
nt 1000 - nt 1362 mit ^^S markierten Nukleotiden 

20 sequenziert und ebenfalls aufgetragen. Das aus der 

Elongation des reversen Primers resultierende Fragment 
von 209 Nukleotiden legt den Transkriptionsstart genau 
an Position 201 fest. Somit wurde die in Beispiel 6a 
erhaltene B345-Sequenz in der S^Region erweitert und ein 

25 neues Startkodon auf Position 283 bestimmt. Durch 

wiederholte Sequenzierungen auch in der 3 'Region wurde, 
im Vergleich zur in SEQ ID N0:1 dargestellten Sequenz, 
eine zusatzliche Base an Position 2430 gefunden, die zu 
einer Leserasterverschiebung fiihrt und somit das 

30 Stoppcodon von Position 2729 auf 2791 verschiebt. Die in 
diesem Versuch erhaltene cDNA (SEQ ID NO: 3) besitzt 
einen offenen Leserahmen, der fur ein potentielles 
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Protein mit einer Lange von 836 Aminosauren (SEQ ID 
NO: 4) kodiert. 



Beispiel 7 

5 Bioinf ormatik-Analyse zur Funktion von B345 

Die resultierende primare Aminosauresequenz von B345 ist 
in SEQ ID NO: 4 gezeigt. Die Analyse des Hydrophilizitats 
Plots der Aminosauresequenz mit der Methode von Kyte und 
Doolittle (1982) zeigt, dass das B345 Protein zwei 

10 charakteristische hydrophobe Domanen aufweist 

(Aminosauren Pos. 1-29 und 666 - 691), die ein 
Signalpeptid und eine helikale Transmembrandomane 
darstellen (Fig, 6) - Diese polarisierte Struktur deutet 
darauf hin, dass es sich bei B345 um ein integrales 

15 Membraneprotein handelt. Die Transmembranhelix verbindet 
einen etwa 666 Aminosauren langen extrazellularen und 
einen kurzen (145 Aminosauren) intrazellularen Teil 
(siehe Fig. 7) . 

Die extrazellulare Domane weist aufierdem klare Indizien 
20 fur die Existenz einer CUB Domane bei Position 220 - 350 
sowie Indizien fur 2 mogliche weitere CUB Domanen im 
Bereich der Aminosauren 425 - 660 auf. CUB Domanen 
kommen bei verschiedenen, meist wahrend der 
Embryonalentwicklung regulierten Proteinen vor. AuBerdem 
2 5 sind manchmal bei EGF (Epidermal Growth 

Factor) -ahnlichen Domanen auch CUB Domanen anzutreffen. 
Eine kiirzlich erschienene Publikation (Gerstein et al., 
2000) demonstriert, daft CUB Domanen enthaltende Proteine 
die am ausgepragtesten dif f erenziell regulierten 
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Proteine in C. elegans sind. Da Gene, die eine 
Schlusselrolle in der Embryonalentwicklung haben, auch 
analoge Funktionen in Krebs ausfiihren, kann angenommen 
werden, dass eine Uberexpression von B345 in Zellen eine 
5 Veranderung in den Eigenschaf ten der Substratadhasion 
Oder der extrazellularen Matrix bewirkt. Das Protein 
weist aufterdem 12 potentielle N- Glycosylierungsstellen 
auf, die in der vorhergesagten extrazellularen Domane zu 
finden sind, was mit der vorhergesagten Orientierung des 
10 Proteins ubereinstimmt . 

Mit einem BLAST hit (E-value: 5.8 x 10"^) fur den Bereich 
der Aminosauren von 235 bis 282 von B345 konnte eine 
Komplement aktivierende Komponente des RA-reactive 
factor (RARE) aus mus musculus identif iziert werden. Das 
15 Alignment befindet sich innerhalb der CUB Domane 1 von 
B345. 

Die CUB-Domanen 2 and 3 (Bereich 425-535 und 545-660) 
weisen marginale Homologien zu dem humanen und Fugu 
Prokollagen C-Proteinase Enhancer Protein (PCOLCE) auf. 
2 0 Diese Regionen kommen in dem Bereich von PCOLCE vor, 

welcher ein CUB Domanen Tandem Repeat enthalt (E-values: 
0.5 (human) und 2.7 (Fugu)). CUB Domanen kommen manchmal 
in Repeats vor. 

* 

Vermutlich bildet das B345-Protein eine J3-Sheet ^ 
25 Sekundarstruktur , da sich CUB Domanen bekanntlich als 
fi-Sandwich falten. | 

Die intrazellulare Domane (Bereich 691-836) weist keine 
signif ikanten Homologien auf. Der gesamte C-Terminus 
aligned jedoch mit einem EST (AW063026) von humanen 
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Eierstockkrebs Zellen (82% Identitat iiber 
124 T^inosauren) - 

Beispiel 8 

Bestimmung der genauen Genstruktur von B345 

Zunachst wurden Bac Klone in offentlichen Datenbanken 
(BLAST search) gesucht, die das B345-Gen enthalten. Die 
Bac Klone Ac068625 und Ac010170 enthielten einen 
GroBteil des Gens. Mit intronspannenden Primern wurden 
Spliceakzeptor und Donorsequenzen in Colo 205 cDNA und 
genomischer DNA als Template gesucht. Das PGR Protokoll 
wurde wie folgt durchgef iihrt : Ix 95°C 2 Minuten, 
35x 95°C 15 Sekunden, 68°C 3 Minuten und dann auf 4°C 
gehalten. Die PGR wurde auf einem 1,2% Agarosegel 
analysiert und dabei die Langen der PGR Produkte der 
2 Templates mit gleichen Primerkombinationen verglichen. 
Es stellte sich heraus, dass B345 aus 8 Exons, getrennt 
von 7 Introns besteht (Fig. 5). 

Die chromosomale Lokalisation des Gens wurde mittels 
Fluoreszenz-in situ-Hybridisierung (FISH) bestimmt. 
Dabei wurde die humane, Digoxigenin-markierte B345 Sonde 
zusammen mit der Biotin-markierten Sonde von B47a2 

(Knight et al., 1997), welche sich auf der sub- 
telomerischen Region des Ghromosomenarms 3p befindet, 
mit Metaphase-Ghromosomen zweier ,;normaler^' Individuen 
hybridisiert (Lichter et al . , 1988), Die hybridisierte 
Digoxygenin-Sonde wurde mittels Anti-Schaf-Dig 

(Boehringer Mannheim FRG) und Kaninchen Anti-Schaf FITG- 
markierten Antikorpern detektiert. Die Biotin markierte 



Probe dagegen wurde mit Maus Anti-Biotin " und Kaninchen- 
Anti-Maus (TRITC)und anschlieBende Farbung mit DAPI 
sichtbar gemacht . Die FISH Resultate zeigen, dass eine 
Mehrheit der Metaphasen eindeutige Signale an einem oder 
beiden Chromatiden des Chromosoms 3 in der Region 
p21-p23 haben. Als Bestatigung der Position diente die 
Co-lokalisation der B47a2 (TRITC) -Sonde auf dem selben 
chromosomalen Arm. . 
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Tab. lA 







PBL 




Lunge 


++ 


Plazenta 


+ 


Dunndarm 


+ 


Leber 


- 


Niere 




Milz 


- 


Thymus 




Kolon 


+ 


Skelettmuskel 




Herz 




Hirn 





T 



Tab. IB 







promyelocytische Leukamie HL60 




HELAZellen S3 


_ 


Chronische Myelogene Leukamie K-562 


+ 


Lymphoblastische Leukamie MOLT-4 




Burkitfs Lymphom (Raji) 




Kolon Adenokarzinom SW480 


+++ 


Lungen Adenokarzinom A549 




Melanom G361 





Tab. IC 







Speiserohre Tumor 


(+) 


Speiserohre Normal 


(+) 


Magen Tumor 




Magen Normal 


+ 


Kolon Tumor 


+++ 


Kolon Normal 


++ 


Mastdarm Tumor 


+ 


Mastdarm Normal 


(+) 



Tab.2A 









Lunge Adenokarzinom 


+ 


+ 


Lunge Adenokarzinom 


+ 


+ 


Lunge Normal 


- bis (+) 


(+) 


Kolon Adenokarzinom 


++ 


++ 


Kolon Adenokarzinom 


+++ 


+++ 


Kolon Normal 


- bis (+) 


+ 


Mamma IDC 


+ . 


+ 


Brust 






Hodgkin's Lymphom 






Milz 






Testis 
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Tab. 2B 



%0 





wiiiiigiiin 


Kolon Adenokarzinom SW480 


+ 


Kolon Normal (Clonetech) 


(+) 


Kolon Normal (Invitrogen) 


(+) 


Lungen Adenokarzinom A549 


(+) 


Kolon Adenokarzinom Colo 205 


+++ 


PG 102142 Tumor (Colon Ac.) 


+++ 


PG 21900 Tumor (Colon Ac.) 


++ 


PG 7066 Tumor (Colon Ac.) 


+++ 


PG 32389 Tumor (Colon Ac.) 


++ 



/ 



/ 

I 
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Patentanspriiche 



Tumorassoziiertes Antigen der Bezeichnung B345, 
dadurch gekennzeichnet , dass es die in 
SEQ ID NO: 4 definierte Aminosauresequenz aufweist 
Oder diese als Teilsequenz enthalt, oder ein 
Fragment davon. 

Isoliertes DNA-Molekul, kodierend fur das in 
Anspruch 1 definierte tumorassoziierte Antigen 
Oder ftir Fragmente davon. 

DNA-Molekiil nach Anspruch 2, dadurch 
gekennzeichnet , dass es ein Polynukleotid mit der 
in SEQ ID NO: 3 dargestellten Sequenz ist oder 
diese Sequenz enthalt oder dass es ein 
Polynukleotid ist oder dieses enthalt, das mit 
einem Polynukleotid der in SEQ ID NO: 3 
dargestellten Sequenz unter stringenten 
Bedingungen hybridisiert , oder ein Fragment davon. 

Rekombinantes DNA-Molekul, enthaltend ein DNA- 
Molekul gemafi Anspruch 2 oder 3. 

Antikorper gegen das in in Anspruch 1 definierte 

« 

Polypeptid. ^ 

Antikorper nach Anspruch 5, dadurch 
gekennzeichnet, dass er monoklonal ist. 

Antikorper nach Anspruch 5 oder 6 fur die Therapie 
und Diagnose von Krebserkrankungen, die mit der 
Expression von B345 assoziiert sind- 



1 



S EQUEN Z PROTOKOLL 

<110> Boehringer Ingelheim International GmbH 

<120> Tumorexprimiertes Polypeptid B345 

<130> casel2_219 

<140> 
<141> 

<160> 40 

<170> Patentin Ver . 2.1 



<210> 1 
<211> 5897 
<212> DNA 
<213> Homo sapiens 

<220> 

<221> 5»UTR 
<222> (1) . . (214) 

<220> 
<221> CDS 

<222> (215) . . (2464) 
<220> 

<221> 3'UTR 
<222> (2465) . . (5897) 

<400> 1 

cttgagatat tagaattcgc gactcctgaa ctgcggggtc tctatcgcac tgctaggggt 60 
tctgctgctg ggtgcggcgc gcctgccgcg cggggcagaa gcttttgaga ttgctctgcc 120 

J; 

acgagaaagc aacattacag ttctcataaa gctggggacc ccgactctgc tggcaaaacc 180 

ctgttacatc gtcatttcta aaagacatat aacc atg ttg tec ate aag tct gga 235 

Met Leu Ser lie Lys Ser Gly 
1 5 

gaa aga ata gtc ttt ace ttt age tgc cag agt cct gag aat cac ttt 283 
Glu Arg lie Val Phe Thr Phe Ser Cys Gin Ser Pro Glu Asn His Phe 
10 15 20 



gtc ata gag ate cag aaa aat att gac tgt atg tea ggc cca tgt cct 331 
Val lie Glu lie Gin Lys Asn lie Asp Cys Met Ser Gly Pro Cys Pro 
. 25 30 35 



ttt ggg gag gtt cag ctt cag ecc teg aea teg ttg ttg eet ace etc 
Phe Gly Glu Val Gin Leu Gin Pro Ser Thr Ser Leu Leu Pro Thr Leu 
40 45 50 55 



379 



2 



aac aga act ttc ate tgg gat gtc aaa get cat aag age" ate ggt tta 427 
Asn Arg Thr Phe lie Trp Asp Val Lys Ala His Lys Ser lie Gly Leu 
60 65 70 

gag ctg cag ttt tec ate eet cgc ctg agg cag ate ggt ccg ggt gag 475 
Glu Leu Gin Phe Ser lie Pro Arg Leu Arg Gin lie Gly Pro Gly Glu 
75 80 85 

age tgc eea gae gga gtc act cac tec ate age ggc cga ate gat gee 523 
Ser Cys Pro Asp Gly Val Thr His Ser lie Ser Gly Arg lie Asp Ala 
90 95 100 

acc gtg gtc agg ate gga acc ttc tgc age aat ggc act gtg tec egg 571 
Thr Val Val Arg lie Gly Thr Phe Cys. Ser Asn Gly Thr Val Ser Arg 
105 110 115 

ate aag atg eaa gaa gga gtg aaa atg gee tta cac etc cca tgg ttc 619 
lie Lys Met Gin Glu Gly Val Lys Met Ala Leu His Leu Pro Trp Phe 
120 125 130 135 

cac cce aga aat gtc tec ggc ttc age att gea aac cgc tea tet ata 667 
His Pro Arg Asn Val Ser Gly Phe Ser lie Ala Asn Arg Ser Ser lie 
140 145 150 

aaa cgt ctg tgc ate ate gag tet gtg ttt gag ggt gaa ggc tea gea 715 
Lys Arg Leu Cys lie lie Glu Ser Val Phe Glu Gly Glu Gly Ser Ala 
155 160 165 

acc ctg atg tet gee aac tac eea gaa ggc ttc eet gag gat gag etc 7 63 
Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe Pro Glu Asp Glu Leu 
170 175 180 

atg aeg tgg cag ttt gtc gtt eet gea cac ctg egg gee age gtc tee 811 
Met Thr Trp Gin Phe Val Val Pro Ala His Leu Arg Ala Ser Val Ser 
185 190 195 

ttc etc aac ttc aac etc tec aac tgt gag agg aag gag gag egg gtt 859 
Phe Leu Asn Phe Asn Leu Ser Asn Cys Glu Arg Lys Glu Glu Arg Val 
200 205 210 215 

gaa tac tac ate ccg ggc tee acc ace aac cec gag gtg ttc aag ctg 907 
Glu Tyr Tyr lie Pro Gly Ser Thr Thr Asn Pro Glu Val Phe Lys Leu 
220 225 230 

gag gae aag cag eet ggg aac atg gcg ggg aac ttc aac etc tet ctg 955 
Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn Phe Asn Leu Ser Leu 
235 240 245 

caa ggc tgt gae eaa gat gee caa agt eea ggg ate etc egg ctg cag 1003 
Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly lie Leu Arg Leu Gin 
250 255 260 

ttc caa gtt ttg gtc eaa eat eea eaa aat gaa age aat aaa ate tac 1051 
Phe Gin Val Leu Val Gin His Pro Gin Asn Glu Ser Asn Lys lie Tyr 
265 270 275 
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gtg gtt gac ttg agt aat gag cga 
Val Val Asp Leu Ser Asn Glu Arg 
280 285 

egg ccc gtc aaa cag age ege aag 
Arg Pro Val Lys Gin Ser Arg Lys 
300 



gee atg tea cte ace ate gag cca 1099 
Ala Met Ser Leu Thr lie Glu Pro 
290 295 

ttt gte cct ggc tgt ttc gtg tgt 1147 
Phe Val Pro Gly Cys Phe Val Cys 
305 310 



eta gaa tct egg aee tge agt age aac etc ace ctg aca tct ggc tec 1195 
Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr Leu Thr Ser Gly Ser 
315 320 325 

aaa eac aaa ate tec ttc ett tgt gat gat ctg aca egt ctg tgg atg 124 3 
Lys His Lys lie Ser Phe Leu Cys Asp Asp Leu Thr Arg Leu Trp Met 
330 335 340 

aat gtg gaa aaa ace at a age tge aca gac eac egg tac tge caa agg 12 91 
Asn Val Glu Lys Thr lie Ser Cys Thr Asp His Arg Tyr Cys Gin Arg 
345 350 355 

aaa tec tac tea etc cag gtg ccc agt gac ate etc eac ctg cct gtg 1339 
Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp lie Leu His Leu Pro Val 
360 365 370 375 

gag ctg cat gac ttc tec tgg aag ctg ctg gtg ccc aag gac agg etc 1387 
Glu Leu His Asp Phe Ser Trp Lys Leu Leu Val Pro Lys Asp Arg Leu 
380 385 390 

age ctg gtg ctg gtg cea gee cag aag ctg cag cag cat aca eac gag 1435 
Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin Gin His Thr His Glu 
395 400 405 

aag ccc tge aac ace age ttc age tac etc gtg gee agt gee ata ccc 1483 
Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val Ala Ser Ala lie Pro 
410 415 420 

age cag gac ctg tac ttc ggc tec ttc tge ceg gga ggc tct ate aag 1531 
Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro Gly Gly Ser He Lys 
425 430 435 

cag ate cag gtg aag cag aac ate teg gtg ace ett ege ace ttt gee 1579 
Gin He Gin Val Lys Gin Asn He Ser Val Thr Leu Arg Thr Phe Ala 
440 445 450 455 

ccc age ttc caa caa gag gee tec agg cag ggt ctg aeg gtg tec ttt 1527 
Pro Ser Phe Gin Gin Glu Ala Ser Arg Gin Gly Leu Thr Val Ser Phe / 
460 465 470 / 

ata cct tat ttc aaa gag gaa ggc gtt ttc aeg gtg ace cct gac aca 'l675 
He Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr Val Thr Pro Asp Thr 
475 480 485 



aaa age aag gte tac ctg agg ace ccc aac tgg gac egg ggc ctg cca 
Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp Asp Arg Gly Leu Pro 
490 495 500 



1723 
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tec etc acc tet gtg tec tgg aac ate age gtg cec aga- gac cag gtg 1771 
Ser Leu Thr Ser Val Ser Trp Asn lie Ser Val Pro Arg Asp Gin Val 
505 510 515 

gee tgc ctg act tte ttt aag gag egg age ggc gtg gtc tgc eag aca 1819 
Ala Cys Leu Thr Phe Phe Lys Glu Arg Ser Gly Val Val Cys Gin Thr 
520 525 530 535 

ggg egc gca ttc atg ate ate cag gag eag egg acc egg get gag gag 1867 
Gly Arg Ala Phe Met lie lie Gin Glu Gin Arg Thr Arg Ala Glu Glu 
540 545 550 

ate ttc age ctg gac gag gat gtg etc cec aag cca age ttc cac eat 1915 
lie Phe Ser Leu Asp Glu Asp Val Leu Pro Lys Pro Ser Phe His His 
555 560 565 

cac age ttc tgg gtc aac ate tet aac tgc age cec aeg age ggc aag 1963 
His Ser Phe Trp Val Asn lie Ser Asn Cys Ser Pro Thr Ser Gly Lys 
570 575 580 

cag eta gac ctg etc tte teg gtg aca ett ace cca agg act gtg gac 2011 
Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr Pro Arg Thr Val Asp 
585 590 595 

ttg act gtc ate etc ate gca geg gtg gga ggt gga gtc tta ctg ctg 2059 
Leu Thr Val lie Leu lie Ala Ala Val Gly Gly Gly Val Leu Leu Xeu 
600 605 610 615 

tet gee etc ggg etc ate att tgc tgt gtg aaa aag aag aaa aag aag 2107 
Ser Ala Leu Gly Leu lie lie Cys Cys Val Lys Lys Lys Lys Lys Lys 
620 625 630 

aca aac aag ggc cec get gtg ggt ate tac aat ggc aac ate aat act 2155 
Thr Asn Lys Gly Pro Ala Val Gly lie Tyr Asn Gly Asn lie Asn Thr 
635 640 645 

gag atg cca ggc age caa aaa agt ttc aga aag ggc gaa agg aca atg 2203 
Glu Met Pro Gly Ser Gin Lys Ser Phe Arg Lys Gly Glu Arg Thr Met 
650 655 660 

act cec atg tgt atg eag tea teg agg aca cca tgg tat atg ggc ate 2251 
Thr Pro Met Cys Met Gin Ser Ser Arg Thr Pro Trp Tyr Met Gly lie 
665 670 675 

tgc tac agg att cca geg get ect tec tgc age cag a^g tgg aca cet 2299 
Cys Tyr Arg lie Pro Ala Ala Pro Ser Cys Ser Gln/Arg Trp Thr Pro 
680 685 690 /' 695 

i 

acc ggc cgt tec agg gca cca tgg ggg tet gtc etc cet ecc cac cca 2347 

Thr Gly Arg Ser Arg Ala Pro Trp Gly Ser Val Leu Pro Pro His Pro 
700 705 710 

cca tat get cca ggg cec caa ctg caa agt tgg cca ctg agg age cac 2395 
Pro Tyr Ala Pro Gly Pro Gin Leu Gin Ser Trp Pro Leu Arg Ser His 
715 720 725 



etc etc get cce etc etg agt etg aga gtg aae egt aea eet tct eee 2443 

Leu Leu Ala Pro Leu Leu Ser Leu Arg Val Asn Arg Thr Pro Ser Pro 
730 735 740 

ate eca aea atg ggg atg taa gcagcaagga eaeagacatt ceettaetga 24 94 

lie Pro Thr Met Gly Met 

745 750 



aeacteagga 


geecatggag 


ecageagaat 


aacttgatcc 


attceagaeg 


etttgetgag 


2554 


ttteataaag 


cagggeaetg 


agaeaeeegt 


ccgtgttect 


aaceagaaat 


eetaaagaag 


2614 


aggaattata 


eagaaggaac 


ageaggaggt 


tttectggae 


acegeeaact 


teaeattget 


2674 


eagtggactc 


attetaaggg 


caagaeattg 


aaaatgatga 


atteeaatet 


ggataeagte 


2734 


atgaeagete 


atgtgetect 


caaettaggc 


tgtgcggtta 


gceagectgt 


aatgagagga 


2794 


gagaggeetg 


agteacetag 


eatagggttg 


cageaagecc 


tggattcaga 


gtgttaaaca 


2854 


gaggcttgec 


etettcagga 


eaaeagttec 


aattceaagg 


ageetacctg 


aggteectae 


2914 


tcteaetggg 


gtecceagga 


tgaaaacgac 


aatgtgcctt 


tttattatta 


tttatttggt 


2974 


ggteetgtgt 


tatttaagag 


ateaaatgta 


taaecaeeta 


gctcttttea 


cetgaettag 


3034 


taataactea 


taetaactgg 


tttggatgce 


tgggttgtga 


ettetaetga 


cegetagata 


3094 


aacgtgtgee 


tgteececag 


gtggtgggaa 


taatttacaa 


tctgtccaae 


cagaaaagaa 


3154 


tgtgtgtgtt 


tgagcageat 


tgaeaeatat 


etgetttgat 


aagagacttc 


etgattetet 


3214 


aggtcggtte 


gtggttatee 


eattgtggaa 


atteatcttg 


aatceeattg 


teetatagte 


3274 


etagcaataa 


gagaaatttc 


eteaagtttc 


catgtgcggt 


teteetaget 


geagcaatae 


3334 


tttgaeattt 


aaagagaaat 


ttagagaata 


ttetcatect 


etaaaaatgt 


ttaaatatat 


3394 


aceaaaeagt 


ggeceectge 


attagtttte 


tgttgecact 


gcaacceatt 


aettggtagc 


3454 


ttaaaaaeaa 


eacattaget 


tatagteetg 


gggateagaa 


ttecaaaatg 


gatgtcectg 


3514 


aatgaaaate 


aaggtgteag 


eagagctgtg 


ctccttetga 


aggetetagg 


gagaagcegg 


3574 


ttcettgeca 


tttcaagctt 


etagag^ctg 


getgcattcc 


caggctecag 


tggctggtca 


3634 


agcttttetc 


acatggeate 


actgtgaeae 


tggeectecc 


acttccctct 


ttgaettaea 


3694 


aagceeaeea 


ggaagateca 


ggataatete 


tccatctaaa 


gatccttcat 


catcetggaa 


3754 


gagecttttg 


eeatgcaaga 


eaaeatagec 


aeaggtgggg 


attaggacea 


ggaeatettt 


3814 


ggggtgetgt 


tattctgeet 


aceaeacctt 


cetgccaebg 


aeteceacag 


gagaggetae 


3874 


aaaatgatet 


ggcgcacagg 


gatgttttgt 


ttagettgcg 


gaetctaaca 


cttaaaaaaa 


3934 


eeceagatca 


gaagatctgg 


ecatgetggg 


gcteaeatte 


teacctagea 


aeaaetggct 


3994 
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ggagctgggc accagctctg cctttagaag 
cacactacgc cctatcactt cccacaatga 
ccctgcaggt tgcatttatt gtaatgaaaa 
gagtagacca tgagaccaat gtgtgctcac 
tttctttttt tttttaatgt gagacaggat 
ggcgcaatct cggctcactg caacctctgc 
gcctcccaaa tagctgggat cactggcaca 
ttgtagagac agggtttcac catgttgccc 
atcctcctgc ctcggcctcc caaagtgctg 
cccacaccct catttatacc aattacctgc 
cctgctctga tctggaagga gagggattat 
aatatttctg cggcaaaaac ttccttcaaa 
ttcaccttgg aaatgcaccg cctcaacttg 
agtctcctaa atggcgtgta ctgcaagacc 
taagtcatgc ccttggcgtt gcctatggca 
cagtgaccct tggccttgtg agccgagatg 
tgcggcttcc ttccctcact gaagagccct 
ctccattctc gacattcccc aacctcccag 
ttccacccaa ggtgggattg gccttcctta 
actgttgcct gcaaggacac cacgtggcca 
ggacaagttg ctggctcctg agaccagtat 
cagcctgagg aaccctggct cttttcttta 
cagggtcact ggaaacagtg aagtgccatt 

0 

ctcatccacg tggtatgcca tgcctacgag 

atgntgtggt cattgcacag aagggaaagg 

aagcccaccg gacatggcct tggtaaaggt 

cttcactgga aataatttat tcattgcaga 

tgtgctttaa ataaacaaat gtaccaaaaa 

tacttgtccc ctggttcagt agaggccccg 



gggtgtccac ttcaccaggt caccacagcc 4054 
ggctaagtgt ttgtttctac tgatcaatgc 4114 
agaaagactg ggattaatct ctaatcaggt 4174 
attacccttt ttcttttttt tctttttctt 4234 
ctcattctgt tgcctaggct ggagtgcagt 4 294 
ctcctgggct caagcaattc tcccacctca 4354 
aaccaccatg cccagctaat tttgtatttt 4414 
aggctggtct caacctcctg ggctcaagca 4 474 
ggattacaga tgtgagccac cgcatccagc 4534 
ccagtaactg tggacttttg cttcctcacc 4594 
gttatagctt gtcagcacag tcccaagttc 4 654 
aaataaatgt acttcattgt attcaatgaa 4714 
ttcacatggc ataaatgaaa ggaattttat 4774 
tcttgaacac tttccagagg ataggatatt 4834 
cctttccctt ctgaaagtct ggttcctgcc 4894 
ctgaccctgc ataaagggcc aaaggagggc 4 954 
tatttgaatt cactgtgtgg agccctagcc 5014 
ccccttccaa gcaggactag gtgccctgca 5074 
ggctggctac ttgtcaccat caccgacatc 5134 
ttttccttca actgagggct caaaactcct 5194 
ttcctggagm tgtgcctcag tgaaggggcc 5254 
aagcccaggc cccacttaca taaaacattt 5314 
tgtngaagcc tactgnatgc cagcccactg 5374 
gaaggccagc gcatgcagga ntggtctcta 5434 
tctcaaggaa gagtcaactg ggacaagcac 54 94 
tagcagactg gtgtgtgtgg atctgcagtg 5554 
tactttttag gtggcatttt attcatttcc 5614 
acaagtatca agctgtttaa gtgcttcggc 5674 
gtttcccagt tgttgactgt gacaggctca 5734 
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gcatgggctc agcagatgct gtcttaattt gtggatgata cagaaagcca ggctttggga 5794 
tacaagttct ttcctcttca tttgatgccg tgcactgtgt gaagcagatg tttttgtccg 5854 
gaaataaaaa taatagtctt ggagtctcgc caaaaaaaaa aag 5897 



<210> 2 
<211> 749 
<212> PRT 

<213> Homo sapiens 
<400> 2 

Met Leu Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe Ser Cys 
15 10 15 

Gin Ser Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn lie Asp 
20 25 30 

Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser 
35 40 45 

Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys 
50 55 60 

Ala His Lys Ser lie Gly Leu Glu Leu Gin Phe Ser lie Pro Arg Leu 
65 70 75 80 

Arg Gin lie Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr His Ser 
85 90 95 

lie Ser Gly Arg lie Asp Ala Thr Val Val Arg lie Gly Thr Phe Cys 
100 105 110 

Ser Asn Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val Lys Met 
115 120 125 

Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser 
130 135 140 

lie Ala Asn Arg Ser Ser lie Lys Arg Leu Cys lie lie Glu Ser Val 
145 150 155 160 

Phe Glu Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu 
165 170 175 

Gly Phe Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val Pro Ala 
180 185 190 

His Leu Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn Cys 
195 200 205 

Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr He Pro Gly Ser Thr Thr 
210 215 220 

Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala 
225 230 235 240 
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Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser 
245 250 255 

Pro Gly lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin 
260 265 270 

Asn Glu Ser Asn Lys lie Tyr Val Val Asp Leu Ser Asn Glu Arg Ala 
275 280 285 

Met Ser Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe 
290 295 300 

Val Pro Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn 
305 310 315 320 

Leu Thr Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu Cys Asp 
325 330 335 

Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser Cys Thr 
340 345 350 

Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser 
355 360 365 

Asp lie Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu 
370 375 380 

Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys 
385 390 395 400 

Leu Gin Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr 
405 410 415 

Leu Val Ala Ser Ala lie Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe 
420 425 430 

Cys Pro Gly Gly Ser lie Lys Gin lie Gin Val Lys Gin Asn lie Ser 
435 440 445 

Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg 
450 455 460 

Gin Gly Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu Gly Val 
465 470 475 480 

Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro 
485 490 495 

Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn lie 
500 505 510 

Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu Arg 
515 520 525 



Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met lie lie Gin Glu 
530 535 540 
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Gin Arg Thr 
545 



Arg Ala Glu 
550 



Glu lie Phe Ser Leu Asp Glu Asp Val Leu 
555 560 



Pro Lys Pro 
Cys Ser Pro 



Ser Phe His 
565 

Thr Ser Gly 
580 



His His Ser Phe Trp Val Asn lie Ser Asn 
570 575 

Lys Gin Leu Asp Leu Leu Phe Ser Val Thr 
585 590 



Leu Thr Pro 
595 

Gly Gly Gly 
610 



Arg Thr Val Asp Leu Thr Val lie Leu lie Ala Ala Val 

600 605 

Val Leu Leu Leu Ser Ala Leu Gly Leu lie lie Cys Cys 
615 620 



Val Lys Lys 
625 

Tyr Asn Gly 
Arg Lys Gly 



Lys Lys Lys 
630 

Asn lie Asn 
645 

Glu Arg Thr 
660 



Lys Thr Asn Lys Gly Pro Ala Val Gly lie 
635 640 

Thr Glu Met Pro Gly Ser Gin Lys Ser Phe 
650 655 

Met Thr Pro Met Cys Met Gin Ser Ser Arg 
665 670 



Thr Pro Trp 
675 

Cys Ser Gin 
690 



Tyr Met Gly 
Arg Trp Thr 



lie Cys Tyr Arg lie Pro Ala Ala Pro Ser 
680 685 

Pro Thr Gly Arg Ser Arg Ala Pro Trp Gly 
695 700 



Ser Val Leu 
705 

Ser Trp Pro 
Val Asn Arg 



Pro Pro His 
710 

Leu Arg Ser 
725 

Thr Pro Ser 
740 



Pro Pro Tyr Ala Pro Gly Pro Gin Leu Gin 
715 720 

His Leu Leu Ala Pro Leu Leu Ser Leu Arg 
730 735 

Pro lie Pro Thr Met Gly Met 
745 



<210> 3 
<211> 6163 
<212> DNA 

<213> Homo sapiens » 

<220> /' 
<221> 5»UTR I 
<222> (1) . . (282) J 

<220> 

<221> GC_signal 
<222> (147) . . (157) 

<220> 

<221> misc_f eature 
<222> (201) . . (209) 

<223> cap signal; Transkriptionsstart 
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<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 

<221> 3'UTR 

<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 
<400> 3 

ccaacgccgc aatggggagt agtagggacc cagcaacccg gtgccgggag ccctgcaccc 60 

tgggagggag aggcggtcgc tgaggcagga agaggaggag gagagagagg agggacgcac 120 

cgggtcagct cgcgatcctg ctgcgcaggg cggggctcgg gccggtccgc ccgcgcgcag 180 

gtgagtgagc cagggcggag cgcagctgcg ccgggcttgg gcgcctgggg ccgccgctcc 240 

ccaccgtcgt tttccccacc gaggccgagg cgtcccggag tc atg gcc ggc ctg 294 

Met Ala Gly Leu 
1 

aac tgc ggg gtc tct ate gca ctg eta ggg gtt ctg ctg ctg ggt gcg 342 
Asn Cys Gly Val Ser lie Ala Leu Leu Gly Val Leu Leu Leu Gly Ala 
5 10 15 20 

gcg cgc ctg ccg cgc ggg gca gaa get ttt gag att get ctg cea cga 390 
Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu lie Ala Leu Pro Arg 
25 30 35 

gaa age aac att aca gtt etc ata aag ctg ggg ace ccg act ctg ctg 438 
Glu Ser Asn lie Thr Val Leu lie Lys Leu Gly Thr Pro Thr Leu Leu 
40 45 50 

gca aaa ccc tgt tac ate gtc att tct aaa aga cat ata ace atg ttg 486 
Ala Lys Pro Cys Tyr lie Val lie Ser Lys Arg His lie Thr Met Leu 
55 60 65 

tec ate aag tct gga gaa aga ata gtc ttt ace ttt age tgc cag agt 534 
Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe Ser Cys Gin Ser 
70 75 . ^ 80 

ect gag aat cae ttt gtc ata gag ate cag aaa aat att gac tgt atg 582 
Pro Glu Asn His Phe Val lie Glu lie ^Gln Lys Asn lie Asp Cys Met 
85 90 J 95 100 

tea ggc cea tgt ect ttt ggg gag gtt cag ett cag cec teg aea teg 630 
Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin Pro Ser Thr Ser 
105 110 115 

ttg ttg ect ace etc aac aga act ttc ate tgg gat gtc aaa get eat 678 
Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp Val Lys Ala His 
120 125 130 
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aag age ate ggt tta gag ctg cag ttt tec ate cct egcctg agg cag 726 

Lys Ser lie Gly Leu Glu Leu Gin Phe Ser lie Pro Arg Leu Arg Gin 

135 140 145 

ate ggt ceg ggt gag age tgc eca gac gga gtc aet cac tec ate age 774 

lie Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr His Ser lie Ser 

150 155 160 

ggc ega ate gat gee ace gtg gtc agg ate gga ace tte tgc age aat 822 

Gly Arg lie Asp Ala Thr Val Val Arg lie Gly Thr Phe Cys Ser Asn 
165 170 175 180 

ggc act gtg tee egg ate aag atg eaa gaa gga gtg aaa atg gee tta 870 

Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val Lys Met Ala Leu 
185 190 195 

cac etc eca tgg tte cac ecc aga aat gtc tec ggc tte age att gea 918 

His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly Phe Ser lie Ala 
^ 200 205 210 

aac egc tea tet ata aaa cgt ctg tgc ate ate gag tet gtg ttt gag 966 

Asn Arg Ser Ser lie Lys Arg Leu Cys lie lie Glu Ser Val Phe Glu 

215 220 225 

ggt gaa ggc tea gea ace ctg atg tet gee aac tac eca gaa ggc tte 1014 

Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr Pro Glu Gly Phe 

230 235 240 

cct gag gat gag etc atg acg tgg cag ttt gtc gtt ect gea cac ctg 1062 

Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val Pro Ala His Leu 
245 250 255 260 

egg gee age gtc tee tte etc aac tte aac etc tec aac tgt gag agg 1110 

Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser Asn Cys Glu Arg 
265 270 275 

aag gag gag egg gtt gaa tac tac ate ceg ggc tec ace acc aac ecc 1158 

Lys Glu Glu Arg Val Glu Tyr Tyr lie Pro Gly Ser Thr Thr Asn Pro 
280 285 290 

gag gtg tte aag ctg gag gac aag cag cct ggg aac atg gcg ggg aac 1206 

Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn Met Ala Gly Asn 

295 300 305 

tte aac etc tet ctg eaa ggc tgt gac eaa gat gee eaa agt eca ggg 1254 

Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala Gin Ser Pro Gly 

- 310 /' 315 320 

/ 

ate etc egg ctg cag tte eaa gtt ttg gtc eaa eat eca eaa aat gaa 1302 

lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His Pro Gin Asn Glu 
325 330 335 340 

age aat aaa ate tac gtg gtt gac ttg agt aat gag ega gee atg tea 1350 

Ser Asn Lys lie Tyr Val Val Asp Leu Ser Asn Glu Arg Ala Met Ser 
345 350 355 
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etc acc ate gag cca egg cee gtc aaa eag age ege aag- ttt gte cct 1398 
Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg Lys Phe Val Pro 
360 365 370 

gge tgt ttc gtg tgt eta gaa tet egg aee tgc agt age aae etc aec 14 4 6 
Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser Ser Asn Leu Thr 
375 380 385 

etg aea tet gge tee aaa eae aaa ate tee ttc ctt tgt gat gat ctg 1494 
Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu Cys Asp Asp Leu 
390 395 400 

aea cgt ctg tgg atg aat gtg gaa aaa aec ata age tgc aea gae cae 1542 
Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser Cys Thr Asp His 
405 410 415 420 

egg tac tge eaa agg aaa tec tac tea etc eag gtg ecc agt gac ate 1590 
Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val Pro Ser Asp lie 
425 430 435 

etc cac ctg cct gtg gag ctg cat gac ttc tec tgg aag ctg ctg gtg 1638 
Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp Lys Leu Leu Val 
440 445 450 

ecc aag gac agg etc age ctg gtg etg gtg cca gee eag aag etg eag 168 6 
Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala Gin Lys Leu Gin 
455 • 460 465 

eag cat aea eae gag aag ecc tgc aae acc age ttc age tac etc gtg 1734 
Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe Ser Tyr Leu Val 
470 475 480 

gee agt gee ata ecc age cag gac ctg tac ttc gge tec ttc tgc ecg 1782 
Ala Ser Ala lie Pro Ser Gin Asp Leu Tyr Phe Gly Ser Phe Cys Pro 
485 490 495 500 

gga gge tet ate aag cag ate eag gtg aag cag aae ate teg gtg acc 1830 
Gly Gly Ser lie Lys Gin lie Gin Val Lys Gin Asn lie Ser Val Thr 
505 510 515 

ctt ege ace ttt gee ecc age ttc eaa eaa gag gee tee agg cag ggt 1878 
Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala Ser Arg Gin Gly 
520 525 530 

etg acg gtg tec ttt ata cct tat ttc aaa gag gaa gge gtt ttc acg 1926 
Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu Gly Val Phe Thr 
535 540 545 

gtg acc cct gac aea aaa age aag gte tac ctg agg acc ecc aae tgg 1974 
Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg Thr Pro Asn Trp 
550 555 560 

gac egg gge ctg cca tec etc ace tet gtg tec tgg aae ate age gtg 2022 
Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp Asn lie Ser Val 
565 570 575 580 
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ccc aga gac cag gtg gcc tgc ctg act ttc ttt aag gag egg age ggc 2070 
Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys Glu Arg Ser Gly 
585 590 595 

gtg gtc tgc cag aca ggg cgc gca ttc atg ate ate eag gag cag egg 2118 
Val Val Cys Gin Thr Gly Arg Ala Phe Met lie lie Gin Glu Gin Arg 
600 605 610 

ace egg get gag gag ate ttc age ctg gac gag gat gtg etc cee aag 2166 
Thr Arg Ala Glu Glu lie Phe Ser Leu Asp Glu Asp Val Leu Pro Lys 
615 620 625 

cca age ttc cae eat cac age ttc tgg gtc aac ate tct aac tgc age 2214 
Pro Ser Phe His His His Ser Phe Trp Val Asn lie Ser Asn Cys Ser 
630 635 640 

ccc aeg age ggc aag cag eta gac ctg etc ttc teg gtg aca ctt ace 2262 
Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser Val Thr Leu Thr 
645 650 655 660 

cca agg act gtg gac ttg act gtc ate etc ate gca gcg gtg gga ggt 2310 
Pro Arg Thr Val Asp Leu Thr Val lie Leu lie Ala Ala Val Gly Gly 
665 670 675 

gga gtc tta ctg ctg tct gcc etc ggg etc ate att tgc tgt gtg aaa 2358 
Gly Val Leu Leu Leu Ser Ala Leu Gly Leu lie lie Cys Cys Val Lys 
680 685 690 

aag aag aaa aag aag aca aac aag ggc ccc get gtg ggt ate tac aat 2406 
Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val Gly lie Tyr Asn 
695 700 705 

ggc aac ate aat act gag atg ccg agg eag cca aaa aag ttt cag aaa 2454 
Gly Asn lie Asn Thr Glu Met Pro Arg Gin Pro Lys Lys Phe Gin Lys 
710 715 720 

ggg ega aag gac aat gac tee eat gtg tat gca gtc ate gag gac ace 2502 
Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val lie Glu Asp Thr 
725 730 735 740 

atg gta tat ggg cat ctg eta cag gat tec age ggc tec ttc ctg cag 2550 
Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser Gly Ser Phe Leu Gin 
745 750 755 

cca gag gtg gac ace tac egg ccg ttc cag ggc ace atg ggg gtc tgt 2598 
Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr Met Gly Val Cys 
760 765 770 

ect cee tec cca cee ace ata tgc tec agg gee cca act gca aag ttg 2 64 6 
Pro Pro Ser Pro Pro Thr lie Cys Ser Arg Ala Pro Thr Ala Lys Leu 
775 780 785 

gee act gag gag cca ect ect cgc tec ect ect gag tct gag agt gaa 2694 
Ala Thr Glu Glu Pro Pro Pro Arg Ser Pro Pro Glu Ser Glu Ser Glu 
790 795 800 



ccg tac acc ttc tec cat ccc aac aat ggg gat gta age* age aag gac 2742 
Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val Ser Ser Lys Asp 
805 810 815 820 

aca gac att ecc tta ctg aac act cag gag ccc atg gag cca gca gaa 27 90 
Thr Asp lie Pro Leu Leu Asn Thr Gin Glu Pro Met Glu Pro Ala Glu 
825 830 835 

taa cttgatccat tecagacgct ttgctgagtt tcataaagea gggcactgag 2843 



acacccgtcc 


gtgttcctaa 


ccagaaatcc 


taaagaagag 


gaattataca 


gaaggaacag 


2903 


caggaggttt 


tectggacac 


cgccaacttc 


acattgetca 


gtggactcat 


tctaagggca 


2963 


agacattgaa 


aatgatgaat 


tccaatctgg 


atacagtcat 


gacagctcat 


gtgctcctca 


3023 


acttaggctg 


tgcggttagc 


cagectgtaa 


tgagaggaga 


gaggcctgag 


tcacetagca 


3083 


tagggttgca 


gcaagccctg 


gattcagagt 


gttaaacaga 


ggcttgccct 


cttcaggaca 


3143 


acagttccaa 


ttccaaggag 


cctacctgag 


gtccctactc 


tcactggggt 


ccccaggatg 


3203 


aaaacgacaa 


tgtgcctttt 


tattattatt 


tatttggtgg 


tcctgtgtta 


tttaagagat 


3263 


caaatgtata 


accacctagc 


tcttttcacc 


tgacttagta 


ataactcata 


ctaactggtt 


3323 


tggatgcctg 


ggttgtgact 


tctactgacc 


gctagataaa 


cgtgtgcctg 


tcccccaggt 


3383 


ggtgggaata 


atttacaatc 


tgtccaacca 


gaaaagaatg 


tgtgtgtttg 


agcagcattg 


3443 


acacatatct 


gctttgataa 


gagacttcct 


gattctctag 


gtcggttcgt 


ggttatccca 


3503 


ttgtggaaat 


tcatettgaa 


tcccattgtc 


ctatagtcct 


agcaataaga 


gaaatttcct 


3563 


caagtttcca 


tgtgcggttc 


tcctagctgc 


agcaatactt 


tgacatttaa 


agagaaattt 


3623 


agagaatatt 


ctcatcctct 


aaaaatgttt 


aaat atatac 


caaacagt gg 


ccccctgcat 


3683 


tagttttctg 


ttgccactgc 


aacccattac 


ttggtagctt 


aaaaacaaca 


cattagctta 


3743 


tagtcctggg 


gatcagaatt 


ccaaaatgga 


tgtccctgaa 


tgaaaatcaa 


ggtgtcagca 


3803 


gagctgtgct 


ccttctgaag 


gctctaggga 


gaagccggtt 


ccttgccatt 


tcaagcttct 


3863 


agaggctggc 


tgcattccca 


ggctccagtg 


gctggtcaag 


cttttctcac 


atggcatcac 


3923 
3983 ; 


tgtgacactg 


gccctcccac 


ttccctcttt 


gacttacaaa 


gcccaccagg 


aagatccagg 


ataatctctc 


catctaaaga 


tccttcatca 


tcctggaaga 


gccttttgcc 


atgcaagaca 


4043 


acatagccac 


aggtggggat 


taggaccagg 


acatctttgg 


ggtgctgtta 


ttctgcctac 


4103 


cacaccttcc 


tgccactgac 


tcccacagga 


gaggctacaa 


aatgatctgg 


cgcacaggga 


4163 


tgttttgttt 


agcttgcgga 


ctctaacact 


taaaaaaacc 


ccagatcaga 


agatctggec 


4223 


atgctggggc 


tcacattcte 


acctagcaac 


aactggctgg 


agctgggcac 


cagctetgce 


4283 



tttagaaggg 


gtgtccactt 


caccaggtca 


ccacagccca 


cactacgccc 


tatcacttcc 


4343 


cacaatgagg 


ctaagtgttt 


gtttctactg 


atcaatgccc 


ctgcaggttg 


catttattgt 


4403 


aatgaaaaag 


aaagactggg 


attaatctct 


aatcaggtga 


gtagaccatg 


agaccaatgt 


4463 


gtgctcacat 


tacccttttt 


cttttttttc 


tttttctttt 


tctttttttt 


tttaatgtga 


4523 


gacaggatct 


cattctgttg 


cctaggctgg 


agtgcagtgg 


cgcaatctcg 


gctcactgca 


4583 


acctctgcct 


cctgggctca 


agcaattctc 


ccacctcagc 


ctcccaaata 


gctgggatca 


4643 


ctggcacaaa 


ccaccatgcc 


cagctaattt 


tgtatttttt 


gtagagacag 


ggtttcacca 


4703 


tgttgcccag 


gctggtctca 


acctcctggg 


ctcaagcaat 


cctcctgcct 


cggcctccca 


4763 


aagtgctggg 


attacagatg 


tgagccaccg 


catccagccc 


cacaccctca 


tttataccaa 


4823 


ttacctgccc 


agtaactgtg 


gacttttgct 


tcctcacccc 


tgctctgatc 


tggaaggaga 


4883 


gggattatgt 


tatagcttgt 


cagcacagtc 


ccaagttcaa 


tatttctgcg 


gcaaaaactt 


4943 


ccttcaaaaa 


ataaatgtac 


ttcattgtat 


tcaatgaatt 


caccttggaa 


•atgcaccgcc 


5003 


tcaacttgtt 


cacatggcat 


aaatgaaagg 


aattttatag 


tctcctaaat 


ggcgtgtact 


5063 


gcaagacctc 


ttgaacactt 


tccagaggat 


aggatattta 


agtcatgccc 


ttggcgttgc 


5123 


ctatggcacc 


tttcccttct 


gaaagtctgg 


ttcctgccca 


gtgacccttg 


gccttgtgag 


5183 


ccgagatgct 


gaccctgcat 


aaagggccaa 


aggagggctg 


cggcttcctt 


ccctcactga 


5243 


agagccctta 


tttgaattca 


ctgtgtggag 


ccctagccct 


ccattctcga 


cattccccaa 


5303 


cctcccagcc 


ccttccaagc 


aggactaggt 


gccctgcatt 


ccacccaagg 


tgggattggc 


5363 


cttccttagg 


ctggctactt 


gtcaccatca 


ccgacatcac 


tgttgcctgc 


aaggacacca 


5423 


cgtggccatt 


ttccttcaac 


tgagggctca 


aaactcctgg 


acaagttgct 


ggctcctgag 


5483 


accagtattt 


cctggagctg 


tgcctcagtg 


aaggggccca 


gcctgaggaa 


ccctggctct 


5543 


tttctttaaa 


gcccaggccc 


cacttacata 


aaacatttca 


gggtcactgg 


aaacagtgaa 


5603 


gtgccatttg 


ttgaagccta 


ctgcatgcca 


gcccactgct 


catccacg-tg 
gctgt ggtca 


gtctgccatg 


5663 


cctacgagga 


aagccacrcac 


atgcaggact 


ggtct ctaat 


ttgcacagaa 


5723 


gggaaaggtc 


tcaaggaaga 


gtcaactggg 


acaagcacaa 


I 

gcccaccgga 


catggccttg 


5783 


gtaaaggtta 


gcagactggt 


gtgtgtggat 


ctgcagtgct 


tcactggaaa 


taatttattc 


5843 


attgcagata 


ctttttaggt 


ggcattttat 


tcatttcctg 


tgctttaaat 


aaacaaatgt 


5903 


accaaaaaac 


aagtatcaag 


ctgtttaagt 


gcttcggcta 


cttgtcccct 


ggttcagtag 


5963 


aggccccggt 


ttcccagttg 


ttgactgtga 


caggctcagc 


atgggctcag 


cagatgctgt 


6023 
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cttaatttgt ggatgataca gaaagccagg ctttgggata caagttcttt cctcttcatt 6083 
tgatgccgtg cactgtgtga agcagatgtt tttgtccgga aataaaaata atagtcttgg 614 3 
agtctcgcca aaaaaaaaaa 6163 



<210> 4 
<211> 836 
<212> PRT 

<213> Homo sapiens 
<400> 4 

Met Ala Gly Leu Asn Cys Gly Val Ser lie Ala Leu Leu Gly Val Leu 
15 10 15 

Leu Leu Gly Ala Ala Arg Leu Pro Arg Gly Ala Glu Ala Phe Glu lie 
20 25 30 

Ala Leu Pro Arg Glu Ser Asn lie Thr Val Leu lie Lys Leu Gly Thr 
35 40 45 

Pro Thr Leu Leu Ala Lys Pro Cys Tyr lie Val lie Ser Lys Arg His 
50 55 . 60 

lie Thr Met Leu Ser lie Lys Ser Gly Glu Arg lie Val Phe Thr Phe 
65 70 75 80 

Ser Cys Gin Ser Pro Glu Asn His Phe Val lie Glu lie Gin Lys Asn 
85 90 95 

lie Asp Cys Met Ser Gly Pro Cys Pro Phe Gly Glu Val Gin Leu Gin 
100 105 110 

Pro Ser Thr Ser Leu Leu Pro Thr Leu Asn Arg Thr Phe lie Trp Asp 
115 120 125 

Val Lys Ala His Lys Ser lie Gly Leu Glu Leu Gin Phe Ser lie Pro 
130 135 140 

Arg Leu Arg Gin lie Gly Pro Gly Glu Ser Cys Pro Asp Gly Val Thr 

145 150 155 160 

* 

His Ser lie Ser Gly Arg lie Asp/ Ala Thr Val Val Arg lie Gly Thr 
165 / 170 175 

I 

Phe Cys Ser Asn Gly Thr Val Ser Arg lie Lys Met Gin Glu Gly Val 
180 ' 185 190 

Lys Met Ala Leu His Leu Pro Trp Phe His Pro Arg Asn Val Ser Gly 
195 200 205 



Phe Ser lie Ala Asn Arg Ser Ser lie Lys Arg Leu Cys lie lie Glu 
210 215 220 
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Ser Val Phe Glu Gly Glu Gly Ser Ala Thr Leu Met Ser Ala Asn Tyr 
225 230 235 240 

Pro Glu Gly Phe Pro Glu Asp Glu Leu Met Thr Trp Gin Phe Val Val 
245 250 255 

Pro Ala His Leu Arg Ala Ser Val Ser Phe Leu Asn Phe Asn Leu Ser 
260 265 270 

Asn Cys Glu Arg Lys Glu Glu Arg Val Glu Tyr Tyr lie Pro Gly Ser 
275 280 285 

Thr Thr Asn Pro Glu Val Phe Lys Leu Glu Asp Lys Gin Pro Gly Asn 
290 295 300 

Met Ala Gly Asn Phe Asn Leu Ser Leu Gin Gly Cys Asp Gin Asp Ala 
305 310 315 320 

Gin Ser Pro Gly lie Leu Arg Leu Gin Phe Gin Val Leu Val Gin His 
325 330 335 

Pro Gin Asn Glu Ser Asn Lys lie Tyr Val Val Asp Leu Ser Asn Glu 
340 345 350 

Arg Ala Met Ser Leu Thr lie Glu Pro Arg Pro Val Lys Gin Ser Arg 
355 . 360 365 

Lys Phe Val Pro Gly Cys Phe Val Cys Leu Glu Ser Arg Thr Cys Ser 
370 375 380 

Ser Asn Leu Thr Leu Thr Ser Gly Ser Lys His Lys lie Ser Phe Leu 
385 390 395 400 

Cys Asp Asp Leu Thr Arg Leu Trp Met Asn Val Glu Lys Thr lie Ser 
405 410 415 

Cys Thr Asp His Arg Tyr Cys Gin Arg Lys Ser Tyr Ser Leu Gin Val 
420 425 430 

Pro Ser Asp lie Leu His Leu Pro Val Glu Leu His Asp Phe Ser Trp 
435 440 445 

Lys Leu Leu Val Pro Lys Asp Arg Leu Ser Leu Val Leu Val Pro Ala 
450 455 460 

Gin Lys Lfii 'Gin Gin His Thr His Glu Lys Pro Cys Asn Thr Ser Phe 
465 / 470 475 480 

Ser Tyr, Leu Val Ala Ser Ala lie Pro Ser Gin Asp Leu Tyr Phe Gly 
^ 485 490 495 

Ser Phe Cys Pro Gly Gly Ser lie Lys Gin lie Gin Val Lys Gin Asn 
500 505 510 



lie Ser Val Thr Leu Arg Thr Phe Ala Pro Ser Phe Gin Gin Glu Ala 
515 520 525 
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Ser Arg Gin Gly Leu Thr Val Ser Phe lie Pro Tyr Phe Lys Glu Glu 
530 535 540 

Gly Val Phe Thr Val Thr Pro Asp Thr Lys Ser Lys Val Tyr Leu Arg 
545 550 555 560 

Thr Pro Asn Trp Asp Arg Gly Leu Pro Ser Leu Thr Ser Val Ser Trp 
565 570 575 

Asn lie Ser Val Pro Arg Asp Gin Val Ala Cys Leu Thr Phe Phe Lys 
580 585 590 

Glu Arg Ser Gly Val Val Cys Gin Thr Gly Arg Ala Phe Met lie lie 
595 600 605 

Gin Glu Gin Arg Thr Arg Ala Glu Glu lie Phe Ser Leu Asp Glu Asp 
610 615 620 

Val Leu Pro Lys Pro Ser Phe His His His Ser Phe Trp Val Asn lie 
625 630 635 640 

Ser Asn Cys Ser Pro Thr Ser Gly Lys Gin Leu Asp Leu Leu Phe Ser 
645 650 655 

Val Thr Leu Thr Pro Arg Thr Val Asp Leu Thr Val lie Leu lie Ala 
660 665 670 

Ala Val Gly Gly Gly Val Leu Leu Leu Ser Ala Leu Gly Leu lie lie 
675 680 685 

Cys Cys Val Lys Lys Lys Lys Lys Lys Thr Asn Lys Gly Pro Ala Val 
690 695 700 

Gly lie Tyr Asn Gly Asn lie Asn Thr Glu Met Pro Arg Gin Pro Lys 
705 710 715 720 

Lys Phe Gin Lys Gly Arg Lys Asp Asn Asp Ser His Val Tyr Ala Val 
725 730 735 

lie Glu Asp Thr Met Val Tyr Gly His Leu Leu Gin Asp Ser Ser Gly 
740 745 750 

Ser Phe Leu Gin Pro Glu Val Asp Thr Tyr Arg Pro Phe Gin Gly Thr 
755 760 765 

Met Gly Val Cys Pro Pro Ser Pro Pro Thr lie Cys Ser Arg Ala Pro 
770 775 780 

Thr Ala Lys Leu Ala Thr Glu Glu Pro Pro Pro Arg Ser Pro Pro Glu 
785 790 795 800 

Ser Glu Ser Glu Pro Tyr Thr Phe Ser His Pro Asn Asn Gly Asp Val 
805 810 815 



Ser Ser Lys Asp Thr Asp lie Pro Leu Leu Asn Thr Gin Glu Pro Met 
820 825 830 
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Giu Pro Ala Glu 
835 



<210> 5 
<211> 23 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 5 

accgcctcaa cttgttcaca tgg 23 



<210> 6 

<211> 26 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 

<400> 6 

ctggtctcag gagccagcaa cttgtc 26 



<210> 7 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 7 

ctcatgacgt ggcagtttgt cgttc 25 



<210> 8 
<211> 2 6 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 8 

ggctcgctca ttactcaagt caacca 



26 



20 



<210> 9 
<211> 36 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Sequenz: Primer 
<400> 9 

attcgcgact gatgatcgat tttttttttt tttttt 36 



<210> 10 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 10 

attcgcgact gatgatcgat 20 



<210> 11 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 11 

gagatattag aattctactc 20 



<210> 12 
<211> 17 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 

/ 

<400> 12 I 
gagtagaatt ctaatat 17 



<210> 13 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 



21 



<223> Beschreibung der kunstlichen Sequenz; Primer ' 
<400> 13 

agtccatgtg aacaagttga gg 22 



<210> 14 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 14 

aattctccca cctcagcctc 20 



<210> 15 

<211> 22 

<212> DNA 

<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 15 

aggatgaaaa cgacaatgtg cc 22 



<210> 16 

<211> 21 

<212> DNA 

<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 16 

agaattgctt gagcccagga g 21 



<210> 17 / 
<211> 21 ; 
<212> DNA . 
<213> Kunstliche Sequenz ' 

<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 17 
caacttcaca 



ttgctcagtg g 



21 



22 



<210> 18 
<211> 25 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 18 

tgagcaagtt cagcctggtt aagtc 25 



<210> 19 
<211> 26 
<212> DNA 

<213> Kiinstiiche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 19 

caccgaatac tcataaagaa ggtccc 26 



<210> 20 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 20 

tagacttcga gcaggagatg gccact 26 



<210> 21 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> * 

<223> Beschreibung der kiinstlichen Sequenz: Primer 

/' 

<400> 21 I 

ccagccatgt acgtagccat 20 



<210> 22 

<211> 19 

<212> DNA 

<213> Kunstliche Sequenz 



<220> 



23 



<223> Beschreibung der kunstlichen Sequenz: Primer ' 
<400> 22 

ccaagaagga aggctggaa 19 



<210> 23 
<211> 25 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 23 

ccatcaccat cttccaggag cgaga 25 



<210> 24 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 24 

ccaagaagga aggctggaa 19 



<210> 25 
<211> 20 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 25 

tgcaggaggc attgctgatg 20 



<210> 26 
<211> 19 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der * kunstlichen Sequenz: Primer 



<400> 26 

aaatcgtgca cttgcaggc 



19 



24 



<210> 27 
<211> 18 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 27 

ttgatgcgtt ccagctga 18 



<210> 28 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 

.<223> Beschreibung der kunstlichen Sequenz; Primer 
<400> 28 

ttgaattcac tgtgtggagc c 21 



<210> 29 

<211> 19 

<212> DNA 

<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 29 

tgcaggcaac agtgatgtc 19 



Tj^ <210> 30 
<211> 24 
<212> DNA 
<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 30 

attggccttc cttaggctgg ctac 24 



<210> 31 
<211> 43 
<212> DNA 

<213> Kunstliche Sequenz 



<220> 



25 



<223> Beschreibung der kunstlichen Sequenz: Primer ' 
<400> 31 

tgtagcgtga agacgacaga aagggcgtgg taccgagctc gag 4 3 



<210> 32 
<211> 22 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 32 

agggcgtggt accgagctcg ag 22 



<210> 33 
<211> 11 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 33 

ggctcgagct c 11 



4 



<210> 34 
<211> 22 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 34 

ggccatgtcc ggtgggcttg tg 22 



<210> 35 / 
<211> 26 ; 
<212> DNA 

<213> Kunstliche Sequenz ' 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 35 

ctcaaaactc ctggacaagt tgctgg 



26 



26 



<210> 36 
<211> 22 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: Primer 
<400> 36 

aaggtgaagg tcggagtcaa eg 22 



<210> 37 
<211> 24 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 37 

ggcagagatg atgacccttt tggc 24 



<210> 38 

<211> 23 

<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<221> 5'UTR 

<222> (1) . . (282) 

<220> 

<221> GC_signal 
<222> (147) . , (157) 

<220> 

<221> misc_feature 
<222> (201) , . (209) 

<223> cap signal; Transkriptionsstart 
<220> 

<221> 3»UTR 

<222> (2794) . . (6163) /' 
<220> 

<221> 3*UTR ' 
<222> (2794) . . (6163) 

<220> 
<221> CDS 

<222> (283) . . (2793) 



<400> 38 

agcagcagaa cccctagcag tgc 



23 



27 



<210> 39 
<211> 26 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 
<400> 39 

agaaccccta gcagtgcgat agagac 



<210> 40 
<211> 27 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Primer 



<400> 40 

gaactgtaat gttgctttct cgtggca 



Fig.lA 
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Fig. 2B 
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Fig. 3b 
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Fig. 6 




